home *** CD-ROM | disk | FTP | other *** search
/ Assembly Language Step by Step / Assembly Language Step by Step.mdf / ForDOS / ASM / 8086HELP.HLP (.txt) next >
Borland Turbo Vision Help  |  1999-07-20  |  277KB  |  3,059 lines

  1. FBHF+:
  2.  80x86 integer opcode help
  3. Welcome to the NASM-IDE 1.4 online help. This section contains details on the Intel 80x86 instruction set, covering instructions supported by the 8086 up to the Pentium(tm) II. This help does not include instructions relating to 3DNow! or SSE. Please refer to the NASM documentation for information on these instructions. 
  4.  Contents
  5.  Using
  6. opcode
  7. listings
  8.  Alphabetical
  9. opcode
  10. listing
  11.  Opcode
  12. listing
  13. minimum
  14. processor
  15. requirement
  16.  Using 80x86 integer opcode help
  17. This help file contains entries for all 80x86 instructions. Each entry contains the following sections: 
  18.  Description
  19. This contains a detailed description of how the instruction works. This information is based on the Intel Architecture Software Developer's Manual Volume 2, Instruction Set Reference (#243191), available from Intel's web site (http://www.intel.com/). 
  20.  Flags affected
  21. Describes any changes to the EFLAGS register as a result of the instruction being executed. !
  22.  Instruction size and timings
  23. Contains a table showing the size of an instruction in bytes and the number of clock cycles the instruction takes to executed. Timings are shown for the 8086 up to the Pentium processor. Instruction pairing information is also included for the Pentium timings. This information is taken from a HTML document available from http://www.quantasm.com/. 6
  24. The following symbols are used in the timing tables: 
  25.  Operands
  26.  acc   = AL, AX or EAX unless specified otherwise
  27.  reg   = any general register
  28.  r8    = any 8-bit register
  29.  r16   = any general purpose 16-bit register
  30.  r32   = any general purpose 32-bit register
  31.  imm   = immediate data
  32.  imm8  = 8-bit immediate data
  33.  imm16 = 16-bit immediate data
  34.  mem   = memory address
  35.  mem8  = address of 8-bit data item
  36.  mem16 = address of 16-bit data item
  37.  mem32 = address of 32-bit data item
  38.  mem48 = address of 48-bit data item
  39.  dest  = 16/32-bit destination
  40.  short = 8-bit destination
  41.  Instruction timings
  42.  n  -  generally refers to a number of repeated counts
  43.  m  -  in a jump or call;
  44.           286     : bytes in next instruction
  45.           386/486 : number of components
  46.                     (each byte of opcode) + 1 (if immediate data)
  47.                     + 1 (if displacement)
  48.  EA = cycles to calculate the Effective Address
  49.           8088/8086: base                             = 5
  50.                      BP + DI or BX + SI               = 7
  51.                      BP + DI + disp or BX + SI + disp = 11
  52.                      index                            = 5
  53.                      BX + DI or BP + SI               = 8
  54.                      BX + DI + disp or BP + SI + disp = 12
  55.                      disp                             = 6
  56.                      segment override                 = +2
  57.           286 - 486: base + index + disp              = +1
  58.                      all others, no penalty
  59.  Instruction length
  60. The byte count includes the opcode length and length of any required displacement or immediate data. If the displacement is optional, it is shown as d() with the possible lengths in parentheses. If the immediate data is optional, it is shown as i() with the possible lengths in parentheses. B
  61.  Pairing categories for Pentium
  62.  NP = not pairable
  63.  UV = pairable in the U pipe or V pipe
  64.  PU = pairable in the U pipe only
  65.  PV = pairable in the V pipe only
  66.  Example
  67. This section contains an example of how the instruction can be used. 
  68. contents
  69. screen
  70.  80x86 integer opcodes (alphabetical)
  71.  AAA                           - ASCII adjust after addition
  72.  AAD                           - ASCII adjust AX before division
  73.  AAM                           - ASCII adjust AX after multiplication
  74.  AAS                           - ASCII adjust AL after subtraction
  75.  ADC                           - Add with carry
  76.  ADD                           - Integer addition
  77.  AND                           - Logical AND
  78.  ARPL                          - Adjusted Requested Privilege Level of selector (286+)
  79.  BOUND                         - Array index bound check (186+)
  80.  BSF                           - Bit scan forward (386+)
  81.  BSR                           - Bit scan reverse (386+)
  82.  BSWAP                         - Byte swap (486+)
  83.  BT                            - Bit test (386+)
  84.  BTC                           - Bit test with compliment (386+)
  85.  BTR                           - Bit test with reset (386+)
  86.  BTS                           - Bit test and set (386+)
  87.  CALL                          - Call subroutine
  88.  CBW                           - Convert byte to word
  89.  CDQ                           - Convert double to quad (386+)
  90.  CLC                           - Clear carry
  91.  CLD                           - Clear direction flag
  92.  CLI                           - Clear interrupt flag
  93.  CLTS                          - Clear task switched flag (286+)
  94.  CMC                           - Complement carry flag
  95.  CMOVcc                        - Conditional move (Pentium Pro+)
  96.  CMP                           - Compare
  97.  CMPS                          - Compare string (byte, word or doubleword)
  98.  CMPXCHG                       - Compare and exchange (486+)
  99.  CMPXCHG8B                     - Compare and exchange 8 bytes (Pentium+)
  100.  CPUID                         - CPU identification (486+)
  101.  CWD                           - Convert word to doubleword
  102.  CWDE                          - Convert word to extended doubleword (386+)
  103.  DAA                           - Decimal adjust AL after addition
  104.  DAS                           - Decimal adjust AL after subtraction
  105.  DEC                           - Decrement
  106.  DIV                           - Unsigned divide
  107.  EMMS                          - Empty MMX state (MMX)
  108.  ENTER                         - Make stack frame for procedure parameters (186+)
  109.  ESC                           - Escape
  110.  HLT                           - Halt CPU
  111.  IDIV                          - Signed integer division
  112.  IMUL                          - Signed multiply
  113.  IN                            - Input byte or word from port
  114.  INC                           - Increment
  115.  INS                           - Input string from port (byte, word or doubleword) (186+)
  116.  INT                           - Interrupt
  117.  INTO                          - Interrupt on overflow
  118.  INVD                          - Invalidate data cache (486+)
  119.  INVLPG                        - Invalidate translation look-aside buffer (TLB) entry (486+)
  120.  IRET/IRETD                    - Interrupt return (IRETD 386+)
  121.  Jcc                           - Jump on condition code
  122.  JMP                           - Unconditional jump
  123.  LAHF                          - Load register flags into AH
  124.  LAR                           - Load access rights (286+)
  125.  LDS                           - Load far pointer
  126.  LEA                           - Load effective address
  127.  LEAVE                         - Restore stack for procedure exit (186+)
  128.  LES                           - Load far pointer
  129.  LFS                           - Load far pointer (386+)
  130.  LGDT                          - Load Global Descriptor Table (286+)
  131.  LGS                           - Load far pointer (386+)
  132.  LIDT                          - Load Interrupt Descriptor Table (286+)
  133.  LLDT                          - Load Local Descriptor Table (286+)
  134.  LMSW                          - Load Machine Status Word (286+)
  135.  LOCK                          - Lock bus
  136.  LODS                          - Load string (byte, word or doubleword)
  137.  LOOP                          - Decrement CX and loop if CX not zero
  138.  LOOPE/LOOPZ                   - Loop while equal / loop while zero
  139.  LOOPNZ/LOOPNE                 - Loop while not zero / loop while not equal
  140.  LSL                           - Load segment limit (286+)
  141.  LSS                           - Load far pointer (386+)
  142.  LTR                           - Load task register (286+)
  143.  MOV                           - Move data
  144.  MOVD                          - Move 32 bits (doubleword) (MMX)
  145.  MOVQ                          - Move 64 bits (quadword) (MMX)
  146.  MOVS                          - Move string (byte, word or doubleword)
  147.  MOVSX                         - Move with sign extend (386+)
  148.  MOVZX                         - Move with zero extend (386+)
  149.  MUL                           - Unsigned multiply
  150.  NEG                           - Two's complement negation
  151.  NOP                           - No operation
  152.  NOT                           - One's compliment negation (Logical NOT)
  153.  OR                            - Inclusive logical OR
  154.  OUT                           - Output data to port
  155.  OUTS                          - Output string to port (byte, word or doubleword) (186+)
  156.  PACKSSWB/PACKSSDW             - Pack with signed saturation (MMX)
  157.  PACKUSWB                      - Pack with unsigned saturation (MMX)
  158.  PADDB/PADDW/PADDD             - Packed add (MMX)
  159.  PADDSB/PADDSW                 - Packed add with saturation (MMX)
  160.  PADDUSB/PADDUSW               - Packed add unsigned with saturation (MMX)
  161.  PAND                          - Logical AND (MMX)
  162.  PANDN                         - Logical AND NOT (MMX)
  163.  PCMPEQB/PCMPEQW/PCMPEQD       - Packed compare for equal (MMX)
  164.  PCMPGTB/PCMPGTW/PCMPGTD       - Packed compare for greater than (MMX)
  165.  PMADDWD                       - Packed multiply and add (MMX)
  166.  PMULHW                        - Packed multiply high (MMX)
  167.  PMULLW                        - Packed multiply low (MMX)
  168.  POP                           - Pop word off stack
  169.  POPA/POPAD                    - Pop all registers onto stack (186+)
  170.  POPF/POPFD                    - Pop flags off stack
  171.  POR                           - Bitwise logical OR (MMX)
  172.  PSLLW/PSLLD/PSLLQ             - Packed shift left logical (MMX)
  173.  PSRAW/PSRAD                   - Packed shift right arithmetic (MMX)
  174.  PSRLW/PSRLD/PSRLQ             - Packed shift right logical (MMX)
  175.  PSUBB/PSUBW/PSUBD             - Packed subtract (MMX)
  176.  PSUBSB/PSUBSW                 - Packed subtract with saturation (MMX)
  177.  PSUBUSB/PSUBUSW               - Packed subtract unsigned with saturation (MMX)
  178.  PUNPCKHBW/PUNPCKHWD/PUNPCKHDQ - Unpack high packed data (MMX)
  179.  PUNPCKLBW/PUNPCKLWD/PUNPCKLDQ - Unpack low packed data (MMX)
  180.  PUSH                          - Push word onto stack
  181.  PUSHA/PUSHAD                  - Push all registers onto stack (186+)
  182.  PUSHF/PUSHFD                  - Push flags onto stack
  183.  PXOR                          - Logical exclusive OR (MMX)
  184.  RCL                           - Rotate through carry left
  185.  RCR                           - Rotate through carry right
  186.  RDMSR                         - Read from Model Specific Register (Pentium+)
  187.  RDPMC                         - Read Performance-Monitoring Counters (MMX/Pentium Pro+)
  188.  RDTSC                         - Read Time-Stamp Counter (Pentium+)
  189.  REP                           - Repeat string operation
  190.  REPE/REPZ                     - Repeat while equal / repeat while zero
  191.  REPNE/REPNZ                   - Repeat while not equal / repeat while not zero
  192.  RET/RETF                      - Return from procedure
  193.  ROL                           - Rotate left
  194.  ROR                           - Rotate right
  195.  RSM                           - Resume from System Management Mode (Pentium+)
  196.  SAHF                          - Store AH register into flags
  197.  SAL                           - Shift arithmetic left
  198.  SAR                           - Shift arithmetic right
  199.  SBB                           - Subtract with borrow / carry
  200.  SCAS                          - Scan string  (byte, word or doubleword)
  201.  SETcc                         - Set byte on condition (386+)
  202.  SGDT                          - Store Global Descriptor Table (286+)
  203.  SIDT                          - Store Interrupt Descriptor Table (286+)
  204.  SHL                           - Shift logical left
  205.  SHR                           - Shift logical right
  206.  SHLD                          - Double precision shift left (386+)
  207.  SHRD                          - Double precision shift right (386+)
  208.  SLDT                          - Store Local Descriptor Table (286+)
  209.  SMSW                          - Store Machine Status Word (286+)
  210.  STC                           - Set carry flag
  211.  STD                           - Set direction flag
  212.  STI                           - Set interrupt flag (enable interrupts)
  213.  STOS                          - Store string (byte, word or doubleword)
  214.  STR                           - Store task register (286+)
  215.  SUB                           - Subtract
  216.  TEST                          - Test for bit pattern (logical compare)
  217.  UD2                           - Undefined instruction
  218.  VERR                          - Verify read (286+)
  219.  VERW                          - Verify write (286+)
  220.  WAIT                          - Wait for coprocessor
  221.  WBINVD                        - Write-back and invalidate data cache (486+)
  222.  WRMSR                         - Write to Model Specific Register (Pentium+)
  223.  XADD                          - Exchange and add (486+)
  224.  XCHG                          - Exchange
  225.  XLAT/XLATB                    - Translate
  226.  XOR                           - Exclusive OR
  227. contents
  228. screen
  229.  80x86 integer opcodes (by processor)
  230.  8086 and above
  231.  AAA                           - ASCII adjust after addition
  232.  AAD                           - ASCII adjust AX before division
  233.  AAM                           - ASCII adjust AX after multiplication
  234.  AAS                           - ASCII adjust AL after subtraction
  235.  ADC                           - Add with carry
  236.  ADD                           - Integer addition
  237.  AND                           - Logical AND
  238.  CALL                          - Call subroutine
  239.  CBW                           - Convert byte to word
  240.  CLC                           - Clear carry
  241.  CLD                           - Clear direction flag
  242.  CLI                           - Clear interrupt flag
  243.  CMC                           - Complement carry flag
  244.  CMP                           - Compare
  245.  CMPS                          - Compare string (byte, word or doubleword)
  246.  CWD                           - Convert word to doubleword
  247.  DAA                           - Decimal adjust AL after addition
  248.  DAS                           - Decimal adjust AL after subtraction
  249.  DEC                           - Decrement
  250.  DIV                           - Unsigned divide
  251.  ESC                           - Escape
  252.  HLT                           - Halt CPU
  253.  IDIV                          - Signed integer division
  254.  IMUL                          - Signed multiply
  255.  IN                            - Input byte or word from port
  256.  INC                           - Increment
  257.  INT                           - Interrupt
  258.  INTO                          - Interrupt on overflow
  259.  IRET                          - Interrupt return
  260.  Jcc                           - Jump on condition code
  261.  JMP                           - Unconditional jump
  262.  LAHF                          - Load register flags into AH
  263.  LDS                           - Load far pointer
  264.  LEA                           - Load effective address
  265.  LES                           - Load far pointer
  266.  LOCK                          - Lock bus
  267.  LODS                          - Load string (byte, word or doubleword)
  268.  LOOP                          - Decrement CX and loop if CX not zero
  269.  LOOPE/LOOPZ                   - Loop while equal / loop while zero
  270.  LOOPNZ/LOOPNE                 - Loop while not zero / loop while not equal
  271.  MOV                           - Move data
  272.  MOVS                          - Move string (byte, word or doubleword)
  273.  MUL                           - Unsigned multiply
  274.  NEG                           - Two's complement negation
  275.  NOP                           - No operation
  276.  NOT                           - One's compliment negation (Logical NOT)
  277.  OR                            - Inclusive logical OR
  278.  OUT                           - Output data to port
  279.  POP                           - Pop word off stack
  280.  POPF/POPFD                    - Pop flags off stack
  281.  PUSH                          - Push word onto stack
  282.  PUSHF/PUSHFD                  - Push flags onto stack
  283.  RCL                           - Rotate through carry left
  284.  RCR                           - Rotate through carry right
  285.  REP                           - Repeat string operation
  286.  REPE/REPZ                     - Repeat while equal / repeat while zero
  287.  REPNE/REPNZ                   - Repeat while not equal / repeat while not zero
  288.  RET/RETF                      - Return from procedure
  289.  ROL                           - Rotate left
  290.  ROR                           - Rotate right
  291.  SAHF                          - Store AH register into flags
  292.  SAL                           - Shift arithmetic left
  293.  SAR                           - Shift arithmetic right
  294.  SBB                           - Subtract with borrow / carry
  295.  SCAS                          - Scan string  (byte, word or doubleword)
  296.  SHL                           - Shift logical left
  297.  SHR                           - Shift logical right
  298.  STC                           - Set carry flag
  299.  STD                           - Set direction flag
  300.  STI                           - Set interrupt flag (enable interrupts)
  301.  STOS                          - Store string (byte, word or doubleword)
  302.  SUB                           - Subtract
  303.  TEST                          - Test for bit pattern (logical compare)
  304.  UD2                           - Undefined instruction
  305.  WAIT                          - Wait for coprocessor
  306.  XCHG                          - Exchange
  307.  XLAT/XLATB                    - Translate
  308.  XOR                           - Exclusive OR
  309.  186 and above
  310.  BOUND                         - Array index bound check (186+)
  311.  ENTER                         - Make stack frame for procedure parameters (186+)
  312.  INS                           - Input string from port (byte, word or doubleword) (186+)
  313.  LEAVE                         - Restore stack for procedure exit (186+)
  314.  OUTS                          - Output string to port (byte, word or doubleword) (186+)
  315.  POPA/POPAD                    - Pop all registers onto stack (186+)
  316.  PUSHA/PUSHAD                  - Push all registers onto stack (186+)
  317.  286 and above
  318.  ARPL                          - Adjusted Requested Privilege Level of selector (286+)
  319.  CLTS                          - Clear task switched flag (286+)
  320.  LAR                           - Load access rights (286+)
  321.  LGDT                          - Load Global Descriptor Table (286+)
  322.  LIDT                          - Load Interrupt Descriptor Table (286+)
  323.  LLDT                          - Load Local Descriptor Table (286+)
  324.  LMSW                          - Load Machine Status Word (286+)
  325.  LSL                           - Load segment limit (286+)
  326.  LTR                           - Load task register (286+)
  327.  SGDT                          - Store Global Descriptor Table (286+)
  328.  SIDT                          - Store Interrupt Descriptor Table (286+)
  329.  SLDT                          - Store Local Descriptor Table (286+)
  330.  SMSW                          - Store Machine Status Word (286+)
  331.  STR                           - Store task register (286+)
  332.  VERR                          - Verify read (286+)
  333.  VERW                          - Verify write (286+)
  334.  386 and above
  335.  BSF                           - Bit scan forward (386+)
  336.  BSR                           - Bit scan reverse (386+)
  337.  BT                            - Bit test (386+)
  338.  BTC                           - Bit test with compliment (386+)
  339.  BTR                           - Bit test with reset (386+)
  340.  BTS                           - Bit test and set (386+)
  341.  CDQ                           - Convert double to quad (386+)
  342.  CWDE                          - Convert word to extended doubleword (386+)
  343.  IRETD                         - Interrupt return (386+)
  344.  LFS                           - Load far pointer (386+)
  345.  LGS                           - Load far pointer (386+)
  346.  LSS                           - Load far pointer (386+)
  347.  MOVSX                         - Move with sign extend (386+)
  348.  MOVZX                         - Move with zero extend (386+)
  349.  SETcc                         - Set byte on condition (386+)
  350.  SHLD                          - Double precision shift left (386+)
  351.  SHRD                          - Double precision shift right (386+)
  352.  486 and above
  353.  BSWAP                         - Byte swap (486+)
  354.  CMPXCHG                       - Compare and exchange (486+)
  355.  CPUID                         - CPU identification (486+)
  356.  INVD                          - Invalidate data cache (486+)
  357.  INVLPG                        - Invalidate translation look-aside buffer (TLB) entry (486+)
  358.  WBINVD                        - Write-back and invalidate data cache (486+)
  359.  XADD                          - Exchange and add (486+)
  360.  Pentium(tm) class and above
  361.  CMPXCHG8B                     - Compare and exchange 8 bytes (Pentium+)
  362.  RDMSR                         - Read from Model Specific Register (Pentium+)
  363.  RDTSC                         - Read Time-Stamp Counter (Pentium+)
  364.  RSM                           - Resume from System Management Mode (Pentium+)
  365.  WRMSR                         - Write to Model Specific Register (Pentium+)
  366.  Pentium Pro(tm) class and above
  367.  CMOVcc                        - Conditional move (Pentium Pro+)
  368.  RDPMC                         - Read Performance-Monitoring Counters (MMX/Pentium Pro+)
  369.  Multimedia Extensions (MMX) opcodes
  370.  EMMS                          - Empty MMX state (MMX)
  371.  MOVD                          - Move 32 bits (doubleword) (MMX)
  372.  MOVQ                          - Move 64 bits (quadword) (MMX)
  373.  PACKSSWB/PACKSSDW             - Pack with signed saturation (MMX)
  374.  PACKUSWB                      - Pack with unsigned saturation (MMX)
  375.  PADDB/PADDW/PADDD             - Packed add (MMX)
  376.  PADDSB/PADDSW                 - Packed add with saturation (MMX)
  377.  PADDUSB/PADDUSW               - Packed add unsigned with saturation (MMX)
  378.  PAND                          - Logical AND (MMX)
  379.  PANDN                         - Logical AND NOT (MMX)
  380.  PCMPEQB/PCMPEQW/PCMPEQD       - Packed compare for equal (MMX)
  381.  PCMPGTB/PCMPGTW/PCMPGTD       - Packed compare for greater than (MMX)
  382.  PMADDWD                       - Packed multiply and add (MMX)
  383.  PMULHW                        - Packed multiply high (MMX)
  384.  PMULLW                        - Packed multiply low (MMX)
  385.  POR                           - Bitwise logical OR (MMX)
  386.  PSLLW/PSLLD/PSLLQ             - Packed shift left logical (MMX)
  387.  PSRAW/PSRAD                   - Packed shift right arithmetic (MMX)
  388.  PSRLW/PSRLD/PSRLQ             - Packed shift right logical (MMX)
  389.  PSUBB/PSUBW/PSUBD             - Packed subtract (MMX)
  390.  PSUBSB/PSUBSW                 - Packed subtract with saturation (MMX)
  391.  PSUBUSB/PSUBUSW               - Packed subtract unsigned with saturation (MMX)
  392.  PUNPCKHBW/PUNPCKHWD/PUNPCKHDQ - Unpack high packed data (MMX)
  393.  PUNPCKLBW/PUNPCKLWD/PUNPCKLDQ - Unpack low packed data (MMX)
  394.  PXOR                          - Logical exclusive OR (MMX)
  395.  RDPMC                         - Read Performance-Monitoring Counters (MMX/Pentium Pro+)
  396. contents
  397. screen
  398.  AAA - ASCII adjust after addition
  399.  Description
  400. Adjusts the sum of two unpacked BCD values to create an unpacked BCD result. The AL register is the implied source and destination operand for this instruction. The AAA instruction is only useful when it follows an ADD instruction that adds (binary addition) two unpacked BCD values and stores a byte result in the AL register. The AAA instruction then adjusts the contents of the AL register to contain the correct 1-digit unpacked BCD result. 
  401. If the addition produces a decimal carry, the AH register is incremented by 1, and the CF and AF flags are set. If there was no decimal carry, the CF and AF flags are cleared and the AH register is unchanged. In either case, bits 4 through 7 of the AL register are cleared to 0. '
  402.  Flags affected
  403. The AF and CF flags are set to 1 if the adjustment results in a decimal carry; otherwise they are cleared to 0. The OF, SF, ZF, and PF flags are undefined. C
  404.  Instruction size and timings
  405.  bytes   8088    186     286     386     486     Pentium
  406.   1       8       8       3       4       3       3   NP
  407.  Example
  408.  aaa       ; ASCII adjust after addition
  409. contents
  410. screen
  411.  AAD - ASCII adjust for division
  412.  Description
  413. Adjusts two unpacked BCD digits (the least-significant digit in the AL register and the most-significant digit in the AH register) so that a division operation performed on the result will yield a correct unpacked BCD value. The AAD instruction is only useful when it precedes a DIV instruction that divides (binary division) the adjusted value in the AX register by an unpacked BCD value. 
  414. The AAD instruction sets the value in the AL register to (AL + (10 * AH)), and then clears the AH register to 00H. The value in the AX register is then equal to the binary equivalent of the original unpacked two-digit (base 10) number in registers AH and AL. '
  415.  Flags affected
  416. The SF, ZF, and PF flags are set according to the result; the OF, AF, and CF flags are undefined. C
  417.  Instruction size and timings
  418.  bytes   8088    186     286     386     486     Pentium
  419.   2      60      15      14      19      14      10   NP
  420.  Example
  421.  aad       ; ASCII adjust for division
  422. contents
  423. screen
  424.  AAM - ASCII adjust for multiplication
  425.  Description
  426. Adjusts the result of the multiplication of two unpacked BCD values to create a pair of unpacked (base 10) BCD values. The AX register is the implied source and destination operand for this instruction. The AAM instruction is only useful when it follows a MUL instruction that multiplies (binary multiplication) two unpacked BCD values and stores a word result in the AX register. The AAM instruction then adjusts the contents of the AX register to contain the correct 2-digit unpacked (base 10) BCD result. '
  427.  Flags affected
  428. The SF, ZF, and PF flags are set according to the result. The OF, AF, and CF flags are undefined. C
  429.  Instruction size and timings
  430.  bytes   8088    186     286     386     486     Pentium
  431.   2      83      19      16      17      15      18   NP
  432.  Example
  433.  aam       ; ASCII adjust for multiplication
  434. contents
  435. screen
  436.  AAS - ASCII adjust after subtraction
  437.  Description
  438. Adjusts the result of the subtraction of two unpacked BCD values to create a unpacked BCD result. The AL register is the implied source and destination operand for this instruction. The AAS instruction is only useful when it follows a SUB instruction that subtracts (binary subtraction) one unpacked BCD value from another and stores a byte result in the AL register. The AAA instruction then adjusts the contents of the AL register to contain the correct 1-digit unpacked BCD result. 
  439. If the subtraction produced a decimal carry, the AH register is decremented by 1, and the CF and AF flags are set. If no decimal carry occurred, the CF and AF flags are cleared, and the AH register is unchanged. In either case, the AL register is left with its top nibble set to 0. &
  440.  Flags affected
  441. The AF and CF flags are set to 1 if there is a decimal borrow; otherwise, they are cleared to 0. -
  442. The OF, SF, ZF, and PF flags are undefined. C
  443.  Instruction size and timings
  444.  bytes   8088    186     286     386     486     Pentium
  445.   1       8       7       3       4       3       3   NP
  446.  Example
  447.  aas       ; ASCII adjust after subtraction
  448. contents
  449. screen
  450.  ADC - Add with carry
  451.  Description
  452. Adds the destination operand (first operand), the source operand (second operand), and the carry (CF) flag and stores the result in the destination operand. 
  453. The destination operand can be a register or a memory location; the source operand can be an immediate, a register, or a memory location. (However, two memory operands cannot be used in one instruction.) 
  454. The state of the CF flag represents a carry from a previous addition. When an immediate value is used as an operand, it is sign-extended to the length of the destination operand format. %
  455. The ADC instruction does not distinguish between signed or unsigned operands. Instead, the processor evaluates the result for both data types and sets the OF and CF flags to indicate a carry in the signed or unsigned result, respectively. The SF flag indicates the sign of the signed result. 
  456. The ADC instruction is usually executed as part of a multibyte or multiword addition in which an ADD instruction is followed by an ADC instruction. '
  457.  Flags affected
  458. The OF, SF, ZF, AF, CF, and PF flags are set according to the result. C
  459.  Instruction size and timings
  460.  operands    bytes   8088    186     286     386     486     Pentium
  461.  reg, reg     2       3       3       2       2       1       1   PU
  462.  mem, reg  2+d(0,2)  24+EA   10       7       7       3       3   PU
  463.  reg, mem  2+d(0,2)  13+EA   10       7       6       2       2   PU
  464.  reg, imm  2+i(1,2)   4       4       3       2       1       1   PU
  465.  mem, imm  2+d(0,2)  23+EA   16       7       7       3       3   PU*
  466.             +i(1,2)
  467.  acc, imm  1+i(1,2)   4       4       3       2       1       1   PU
  468.  * = not pairable if there is a displacement and immediate
  469.  Example
  470.  adc  eax, ebx  ; add with carry
  471. contents
  472. screen
  473.  ADD - addition
  474.  Description
  475. Adds the first operand (destination operand) and the second operand (source operand) and stores the result in the destination operand. The destination operand can be a register or a memory location; the source operand can be an immediate, a register, or a memory location. (However, two memory operands cannot be used in one instruction.) u
  476. When an immediate value is used as an operand, it is sign-extended to the length of the destination operand format. 
  477. The ADD instruction does not distinguish between signed or unsigned operands. Instead, the processor evaluates the result for both data types and sets the OF and CF flags to indicate a carry in the signed or unsigned result, respectively. 6
  478. The SF flag indicates the sign of the signed result. '
  479.  Flags affected
  480. The OF, SF, ZF, AF, CF, and PF flags are set according to the result. C
  481.  Instruction size and timings
  482.  operands    bytes   8088    186     286     386     486     Pentium
  483.  reg, reg     2       3       3       2       2       1       1   UV
  484.  mem, reg  2+d(0,2)  24+EA   10       7       7       3       3   UV
  485.  reg, mem  2+d(0,2)  13+EA   10       7       6       2       2   UV
  486.  reg, imm  2+i(1,2)   4       4       3       2       1       1   UV
  487.  mem, imm  2+d(0,2)  23+EA   16       7       7       3       3   UV*
  488.             +i(1,2)
  489.  acc, imm  1+i(1,2)   4       4       3       2       1       1   UV
  490.  * = not pairable if there is a displacement and immediate
  491.  Example
  492.  add  eax, ebx  ; addition
  493. contents
  494. screen
  495.  AND - Logical AND
  496.  Description
  497. Performs a bitwise AND operation on the destination (first) and source (second) operands and stores the result in the destination operand location. The source operand can be an immediate, a register, or a memory location; the destination operand can be a register or a memory location. (However, two memory operands cannot be used in one instruction.) Each bit of the result of the AND instruction is a 1 if both corresponding bits of the operands are 1; otherwise, it becomes a 0. '
  498.  Flags affected
  499. The OF and CF flags are cleared; the SF, ZF, and PF flags are set according to the result. The state of the AF flag is undefined. C
  500.  Instruction size and timings
  501.  operands    bytes   8088    186     286     386     486     Pentium
  502.  reg, reg     2       3       3       2       2       1       1   UV
  503.  mem, reg  2+d(0,2)  24+EA   10       7       7       3       3   UV
  504.  reg, mem  2+d(0,2)  13+EA   10       7       6       2       2   UV
  505.  reg, imm  2+i(1,2)   4       4       3       2       1       1   UV
  506.  mem, imm  2+d(0,2)  23+EA   16       7       7       3       3   UV*
  507.             +i(1,2)
  508.  acc, imm  1+i(1,2)   4       4       3       2       1       1   UV
  509.  * = not pairable if there is a displacement and immediate
  510.  Example
  511.  and  eax, abx  ; logical AND
  512. contents
  513. screen
  514.  ARPL - Adjust RPL field of segment selector (286+)
  515.  Description
  516. Compares the RPL fields of two segment selectors. The first operand (the destination operand) contains one segment selector and the second operand (source operand) contains the other. (The RPL field is located in bits 0 and 1 of each operand.) 
  517. If the RPL field of the destination operand is less than the RPL field of the source operand, the ZF flag is set and the RPL field of the destination operand is increased to match that of the source operand. Otherwise, the ZF flag is cleared and no change is made to the destination operand. (The destination operand can be a word register or a memory location; the source operand must be a word register.) V
  518. The ARPL instruction is provided for use by operating-system procedures (however, it can also be used by applications). It is generally used to adjust the RPL of a segment selector that has been passed to the operating system by an application program to match the privilege level of the application program. Here the segment selector passed to the operating system is placed in the destination operand and segment selector for the application program's code segment is placed in the source operand. (The RPL field in the source operand represents the privilege level of the application program.) S
  519. Execution of the ARPL instruction then insures that the RPL of the segment selector received by the operating system is no lower (does not have a higher privilege) than the privilege level of the application program. (The segment selector for the application program's code segment can be read from the stack following a procedure call.) '
  520.  Flags affected
  521. The ZF flag is set to 1 if the RPL field of the destination operand is less than that of the source operand; otherwise, is cleared to 0. C
  522.  Instruction size and timings
  523.  operands   bytes                   286     386     486     Pentium
  524.  reg, reg    2                      10      20       9       7   NP
  525.  mem, reg  2+d(0-2)                 11      21       9       7   NP
  526.  Example
  527.  arpl  ax, bx  ; Adjust RPL field of selector
  528. contents
  529. screen
  530.  BOUND - Check array index against bounds (186+)
  531.  Description
  532. Determines if the first operand (array index) is within the bounds of an array specified the second operand (bounds operand). The array index is a signed integer located in a register. The bounds operand is a memory location that contains a pair of signed doubleword-integers (when the operand-size attribute is 32) or a pair of signed word-integers (when the operand-size attribute is 16). 
  533. The first doubleword (or word) is the lower bound of the array and the second doubleword (or word) is the upper bound of the array. The array index must be greater than or equal to the lower bound and less than or equal to the upper bound plus the operand size in bytes. 
  534. If the index is not within bounds, a BOUND range exceeded exception (#BR) is signaled. (When a this exception is generated, the saved return instruction pointer points to the BOUND instruction.) 
  535. The bounds limit data structure (two words or doublewords containing the lower and upper limits of the array) is usually placed just before the array itself, making the limits addressable via a constant offset from the beginning of the array. Because the address of the array already will be present in a register, this practice avoids extra bus cycles to obtain the effective address of the array bounds. '
  536.  Flags affected
  537. None. C
  538.  Instruction size and timings
  539.  operands  bytes           186     286     386     486     Pentium
  540.  reg, mem    4             35      13      10       7       8   NP
  541.  Example
  542.  bound  bx, array       ; check array index (bx) against bounds
  543. contents
  544. screen
  545.  BSF - Bit scan forward (386+)
  546.  Description
  547. Searches the source operand (second operand) for the least significant set bit (1 bit). If a least significant 1 bit is found, its bit index is stored in the destination operand (first operand). 
  548. The source operand can be a register or a memory location; the destination operand is a register. The bit index is an unsigned offset from bit 0 of the source operand. If the contents source operand are 0, the contents of the destination operand is undefined. '
  549.  Flags affected
  550. The ZF flag is set to 1 if all the source operand is 0; otherwise, the ZF flag is cleared. The CF, OF, SF, AF, and PF, flags are undefined. C
  551.  Instruction size and timings
  552.  operands    bytes                           386     486     Pentium
  553.  r16, r16     3                             10+3n    6-42   6-34  NP
  554.  r32, r32     3                             10+3n    6-42   6-42  NP
  555.  r16, m16  3+d(0,1,2)                       10+3n    7-43   6-35  NP
  556.  r32, m32  3+d(0,1,2,4)                     10+3n    7-43   6-43  NP
  557.  Example
  558.  bsf  eax, [esi]  ; Bit scan forward
  559. contents
  560. screen
  561.  BSR - Bit scan reverse (386+)
  562.  Description
  563. Searches the source operand (second operand) for the most significant set bit (1 bit). If a most significant 1 bit is found, its bit index is stored in the destination operand (first operand). The source operand can be a register or a memory location; the destination operand is a register. The bit index is an unsigned offset from bit 0 of the source operand. If the contents source operand are 0, the contents of the destination operand is undefined. '
  564.  Flags affected
  565. The ZF flag is set to 1 if all the source operand is 0; otherwise, the ZF flag is cleared. The CF, OF, SF, AF, and PF, flags are undefined. C
  566.  Instruction size and timings
  567.  operands    bytes                           386     486     Pentium
  568.  r16, r16     3                             10+3n    6-103  7-39  NP
  569.  r32, r32     3                             10+3n    7-104  7-71  NP
  570.  r16, m16  3+d(0,1,2)                       10+3n    6-103  7-40  NP
  571.  r32, m32  3+d(0,1,2,4)                     10+3n    7-104  7-72  NP
  572.  Example
  573.  bsr  eax, [esi]  ; Bit scan reverse
  574. contents
  575. screen
  576.  BSWAP - Byte swap (486+)
  577.  Description
  578. Reverses the byte order of a 32-bit (destination) register: bits 0 through 7 are swapped with bits 24 through 31, and bits 8 through 15 are swapped with bits 16 through 23. This instruction is provided for converting little-endian values to big-endian format and vice versa. To swap bytes in a word value (16-bit register), use the XCHG instruction. When the BSWAP instruction references a 16-bit register, the result is undefined. '
  579.  Flags affected
  580. None. C
  581.  Instruction size and timings
  582.  operand   bytes                                   486     Pentium
  583.  r32        2                                       1       1   NP
  584.  Example
  585.  bswap  eax  ; byte swap
  586. contents
  587. screen
  588.  BT - Bit test (386+)
  589.  Description
  590. Selects the bit in a bit string (specified with the first operand, called the bit base) at the bit-position designated by the bit offset operand (second operand) and stores the value of the bit in the CF flag. f
  591. The bit base operand can be a register or a memory location; the bit offset operand can be a register or an immediate value. If the bit base operand specifies a register, the instruction takes the modulo 16 or 32 (depending on the register size) of the bit offset operand, allowing any bit position to be selected in a 16- or 32-bit register, respectively. ?
  592. If the bit base operand specifies a memory location, it represents the address of the byte in memory that contains the bit base (bit 0 of the specified byte) of the bit string. The offset operand then selects a bit position within the range -2^31 to 2^31 - 1 for a register offset and 0 to 31 for an immediate offset. '
  593.  Flags affected
  594. The CF flag contains the value of the selected bit. The OF, SF, ZF, AF, and PF flags are undefined. C
  595.  Instruction size and timings
  596.  operands     bytes                           386     486     Pentium
  597.  reg, reg      3                               3       3       4   NP
  598.  mem, reg    3+d(0,1,2,4)                     12       8       9   NP
  599.  reg, imm8     3+i(1)                          3       3       4   NP
  600.  mem, imm8   3+d(0,1,2,4)+i(1)                 6       3       4   NP
  601.  Example
  602.  bt  eax, 4  ; Bit test
  603. contents
  604. screen
  605.  BTC - Bit test and complement (386+)
  606.  Description
  607. Selects the bit in a bit string (specified with the first operand, called the bit base) at the bit-position designated by the bit offset operand (second operand), stores the value of the bit in the CF flag, and complements the selected bit in the bit string. f
  608. The bit base operand can be a register or a memory location; the bit offset operand can be a register or an immediate value. If the bit base operand specifies a register, the instruction takes the modulo 16 or 32 (depending on the register size) of the bit offset operand, allowing any bit position to be selected in a 16- or 32-bit register, respectively. 
  609. If the bit base operand specifies a memory location, it represents the address of the byte in memory that contains the bit base (bit 0 of the specified byte) of the bit string. 
  610. The offset operand then selects a bit position within the range -2^31 to 2^31 - 1 for a register offset and 0 to 31 for an immediate offset. '
  611.  Flags affected
  612. The CF flag contains the value of the selected bit before it is complemented. The OF, SF, ZF, AF, and PF flags are undefined. C
  613.  Instruction size and timings
  614.  operands    bytes                           386     486     Pentium
  615.  reg, reg     3                               6       6       7   NP
  616.  mem, reg   3+d(0,1,2,4)                     13      13      13   NP
  617.  reg, imm8    3+i(1)                          6       6       7   NP
  618.  mem, imm8  3+d(0,1,2,4)+i(1)                 8       8       8   NP
  619.  Example
  620.  btc  eax, 4  ; Bit test and complement
  621. contents
  622. screen
  623.  BTR - Bit test and reset (386+)
  624.  Description
  625. Selects the bit in a bit string (specified with the first operand, called the bit base) at the bit-position designated by the bit offset operand (second operand), stores the value of the bit in the CF flag, and clears the selected bit in the bit string to 0. The bit base operand can be a register or a memory location; the bit offset operand can be a register or an immediate value. 
  626. If the bit base operand specifies a register, the instruction takes the modulo 16 or 32 (depending on the register size) of the bit offset operand, allowing any bit position to be selected in a 16- or 32-bit register, respectively. 
  627. If the bit base operand specifies a memory location, it represents the address of the byte in memory that contains the bit base (bit 0 of the specified byte) of the bit string. 
  628. The offset operand then selects a bit position within the range -2^31 to 2^31 - 1 for a register offset and 0 to 31 for an immediate offset. '
  629.  Flags affected
  630. The CF flag contains the value of the selected bit before it is cleared. The OF, SF, ZF, AF, and PF flags are undefined. C
  631.  Instruction size and timings
  632.  operands    bytes                           386     486     Pentium
  633.  reg, reg     3                               6       6       7   NP
  634.  mem, reg   3+d(0,1,2,4)                     13      13      13   NP
  635.  reg, imm8    3+i(1)                          6       6       7   NP
  636.  mem, imm8  3+d(0,1,2,4)+i(1)                 8       8       8   NP
  637.  Example
  638.  btr  eax, 4    ; Bit test and reset
  639. contents
  640. screen
  641.  BTS - Bit test and set (386+)
  642.  Description
  643. Selects the bit in a bit string (specified with the first operand, called the bit base) at the bit-position designated by the bit offset operand (second operand), stores the value of the bit in the CF flag, and sets the selected bit in the bit string to 1. The bit base operand can be a register or a memory location; the bit offset operand can be a register or an immediate value. 
  644. If the bit base operand specifies a register, the instruction takes the modulo 16 or 32 (depending on the register size) of the bit offset operand, allowing any bit position to be selected in a 16- or 32-bit register, respectively. 
  645. If the bit base operand specifies a memory location, it represents the address of the byte in memory that contains the bit base (bit 0 of the specified byte) of the bit string). 
  646. The offset operand then selects a bit position within the range -2^31 to 2^31 - 1 for a register offset and 0 to 31 for an immediate offset. '
  647.  Flags affected
  648. The CF flag contains the value of the selected bit before it is set. The OF, SF, ZF, AF, and PF flags are undefined. C
  649.  Instruction size and timings
  650.  operands    bytes                           386     486     Pentium
  651.  reg, reg     3                               6       6       7   NP
  652.  mem, reg   3+d(0,1,2,4)                     13      13      13   NP
  653.  reg, imm8    3+i(1)                          6       6       7   NP
  654.  mem, imm8  3+d(0,1,2,4)+i(1)                 8       8       8   NP
  655.  Example
  656.  bts  eax, 4    ; Bit test and set
  657. contents
  658. screen
  659.  CALL - procedure call
  660.  Description
  661. Pushes the Instruction Pointer (and Code Segment for far calls) onto the stack and loads Instruction Pointer with the address of the procedure. Code continues with execution at CS:IP. &
  662.  Flags affected
  663. None. B
  664.  Instruction size and timings
  665.  operand    bytes   8088    186     286     386     486     Pentium
  666.  near        3      23      14      7+m     7+m      3       1   PV
  667.  reg         2      20      13      7+m     7+m      5       2   NP
  668.  mem16    2+d(0-2)  29+EA   19      11+m    10+m     5       2   NP
  669.  far         5      36      23      13+m    17+m    18       4   NP
  670.  mem32    2+d(0-2)  53+EA   38      16+m    22+m    17       4   NP
  671.  Protected Mode
  672.  operand    bytes                   286     386     486     Pentium
  673.  far         5                      26+m    34+m    20     4-13  NP
  674.  mem32    2+d(0-2)                  29+m    38+m    20     5-14  NP
  675.  Cycles not shown for calls through call and task gates
  676.  Example
  677.  call my_procedure      ; Call procedure 'my_procedure'
  678. contents
  679. screen
  680.  CBW - Convert byte to word
  681.  Description
  682. Converts byte in AL to word value in AX by extending sign of AL throughout register AH. '
  683.  Flags affected
  684. None. C
  685.  Instruction size and timings
  686.  bytes   8088    186     286     386     486     Pentium
  687.   1       2       2       2       3       3       3   NP
  688.  Example
  689.  cbw       ; Convert byte to word
  690. contents
  691. screen
  692.  CDQ - Convert double to quad (386+)
  693.  Description
  694. Converts signed DWORD in EAX to a signed quad word in EDX:EAX by extending the high order bit of EAX throughout EDX. '
  695.  Flags affected
  696. None. C
  697.  Instruction size and timings
  698.  bytes                           386     486     Pentium
  699.   1                               2       3       2   NP
  700.  Example
  701.  cdq       ; Convert double to quad
  702. contents
  703. screen
  704.  CLC - Clear carry
  705.  Description
  706. Clears the Carry Flag in the EFLAGS register (sets it to 0). &
  707.  Flags affected
  708. Modifies CF. C
  709.  Instruction size and timings
  710.  bytes   8088    186     286     386     486     Pentium
  711.   1       2       2       2       2       2       2   NP
  712.  Example
  713.  clc       ; Clear carry flag
  714. contents
  715. screen
  716.  CLD - Clear direction flag
  717.  Description
  718. Clears the Direction Flag in the EFLAGS register causing string instructions to increment the (E)SI and (E)DI index registers. '
  719.  Flags affected
  720. Modifies DF. C
  721.  Instruction size and timings
  722.  bytes   8088    186     286     386     486     Pentium
  723.   1       2       2       2       2       2       2   NP
  724.  Example
  725.  cld       ; Clear direction flag
  726. contents
  727. screen
  728.  CLI - Clear interrupt flag
  729.  Description
  730. Clears the IF flag in the EFLAGS register. No other flags are affected. Clearing the IF flag causes the processor to ignore maskable external interrupts. The IF flag and the CLI and STI instructions have no affect on the generation of exceptions and NMI interrupts. '
  731.  Flags affected
  732. Modifies IF. C
  733.  Instruction size and timings
  734.  bytes   8088    186     286     386     486     Pentium
  735.   1       2       2       3       3       5       7   NP
  736.  Example
  737.  cli       ; Clear interrupt flag
  738. contents
  739. screen
  740.  CLTS - Clear task switched flag (286+)
  741.  Description
  742. Clears the task-switched (TS) flag in the CR0 register. This instruction is intended for use in operating-system procedures. It is a privileged instruction that can only be executed at a CPL of 0. It is allowed to be executed in real-address mode to allow initialization for protected mode. 
  743. The processor sets the TS flag every time a task switch occurs. The flag is used to synchronize the saving of FPU context in multitasking applications. '
  744.  Flags affected
  745. Modifies the TS flag in the CR0 register. C
  746.  Instruction size and timings
  747.  bytes                   286     386     486     Pentium
  748.   2                       3       5       7      10   NP
  749.  Example
  750.  clts       ; Clear task switched flag
  751. contents
  752. screen
  753.  CMC - Complement carry flag
  754.  Description
  755. Complements the carry flag in the EFLAGS register. '
  756.  Flags affected
  757. Modifies CF to the value of ~CF. C
  758.  Instruction size and timings
  759.  bytes   8088    186     286     386     486     Pentium
  760.   1       2       2       2       2       2       2   NP
  761.  Example
  762.  cmc        ; Complement carry flag
  763. contents
  764. screen
  765.  CMOVcc - Conditional move
  766.  Description
  767. The CMOVcc instructions check the state of one or more of the status flags in the EFLAGS register (CF, OF, PF, SF, and ZF) and perform a move operation if the flags are in a specified state (or condition). A condition code (cc) is associated with each instruction to indicate the condition being tested for. If the condition is not satisfied, a move is not performed and execution continues with the instruction following the CMOVcc instruction. 
  768. These instructions can move a 16 or 32 bit value from memory to a general purpose register or from one general purpose register to another. Conditional moves of 8 bit register operands are not supported. 
  769. The conditions for each CMOVcc mnemonic is given in the description column of the table below. The terms "less" and "greater" are used for comparisons of signed integers and the terms "above" and "below" are used for unsigned integers. 2
  770. Because a particular state of the status flags can sometimes be interpreted in two ways, two mnemonics are defined for some opcodes. For example, the CMOVA (conditional move if above) instruction and the CMOVNBE (conditional move if not below or equal) instruction are alternate mnemonics for the opcode. 
  771. The CMOVcc instructions are new for the Pentium Pro processor family; however, they may not be supported by all the processors in the family. Software can determine if the CMOVcc instructions are supported by checking the processor's feature information with the CPUID instruction. 
  772.  Instruction    Description
  773.  CMOVA          Move if above (CF=0 and ZF=0)
  774.  CMOVAE         Move if above or equal (CF=0)
  775.  CMOVB          Move if below (CF=1)
  776.  CMOVBE         Move if below or equal (CF=1 or ZF=1)
  777.  CMOVC          Move if carry (CF=1)
  778.  CMOVE          Move if equal (ZF=1)
  779.  CMOVG          Move if greater (ZF=0 and SF=OF)
  780.  CMOVGE         Move if greater or equal (SF=OF)
  781.  CMOVL          Move if less (SF<>OF)
  782.  CMOVLE         Move if less or equal (ZF=1 or SF<>OF)
  783.  CMOVNA         Move if not above (CF=1 or ZF=1)
  784.  CMOVNAE        Move if not above or equal (CF=1)
  785.  CMOVNB         Move if not below (CF=0)
  786.  CMOVNBE        Move if not below or equal (CF=0 and ZF=0)
  787.  CMOVNC         Move if not carry (CF=0)
  788.  CMOVNE         Move if not equal (ZF=0)
  789.  CMOVNG         Move if not greater (ZF=1 or SF<>OF)
  790.  CMOVNGE        Move if not greater or equal (SF<>OF)
  791.  CMOVNL         Move if not less (SF=OF)
  792.  CMOVNLE        Move if not less or equal (ZF=0 and SF=OF)
  793.  CMOVNO         Move if not overflow (OF=0)
  794.  CMOVNP         Move if not parity (PF=0)
  795.  CMOVNS         Move if not sign (SF=0)
  796.  CMOVNZ         Move if not zero (ZF=0)
  797.  CMOVO          Move if overflow (OF=0)
  798.  CMOVP          Move if parity (PF=1)
  799.  CMOVPE         Move if parity even (PF=1)
  800.  CMOVPO         Move if parity odd (PF=0)
  801.  CMOVS          Move if sign (SF=1)
  802.  CMOVZ          Move if zero (ZF=1)
  803.  Flags affected
  804. None. C
  805.  Instruction size and timings
  806. Not available. 
  807.  Example
  808.  cmovs ax, bx   ; Move ax to bx if the sign flag is set (SF = 1)
  809. contents
  810. screen
  811.  CMP - Compare two operands
  812.  Description
  813. Compares the first source operand with the second source operand and sets the status flags in the EFLAGS register according to the results. The comparison is performed by subtracting the second operand from the first operand and then setting the status flags in the same manner as the SUB instruction. h
  814. When an immediate value is used as an operand, it is sign-extended to the length of the first operand. 
  815. The CMP instruction is typically used in conjunction with a conditional jump (Jcc), condition move (CMOVcc), or SETcc instruction. The condition codes used by the Jcc, CMOVcc, and SETcc instructions are based on the results of a CMP instruction. '
  816.  Flags affected
  817. The CF, OF, SF, ZF, AF, and PF flags are set according to the result. C
  818.  Instruction size and timings
  819.  operands    bytes   8088    186     286     386     486     Pentium
  820.  reg, reg     2       3       3       2       2       1       1   UV
  821.  mem, reg  2+d(0,2)  13+EA   10       7       5       2       2   UV
  822.  reg, mem  2+d(0,2)  13+EA   10       6       6       2       2   UV
  823.  reg, imm  2+i(1,2)   4       4       3       2       1       1   UV
  824.  mem, imm  2+d(0,2)  14+EA   10       6       5       2       2   UV*
  825.             +i(1,2)
  826.  acc, imm  1+i(1,2)   4       4       3       2       1       1   UV
  827.         * = not pairable if there is a displacement and immediate
  828.  Example
  829.  cmp eax, 3     ; Compare eax register with 3
  830. contents
  831. screen
  832.  CMPS - Compare string operands
  833.  Description
  834. Compares the byte, word, or double word specified with the first source operand with the byte, word, or double word specified with the second source operand and sets the status flags in the EFLAGS register according to the results. 
  835. Both the source operands are located in memory. The address of the first source operand is read from either the DS:ESI or the DS:SI registers (depending on the address-size attribute of the instruction, 32 or 16, respectively). 
  836. The address of the second source operand is read from either the ES:EDI or the ES:DI registers (again depending on the address-size attribute of the instruction). The DS segment may be overridden with a segment override prefix, but the ES segment cannot be overridden. 
  837. After the comparison, the (E)SI and (E)DI registers are incremented or decremented automatically according to the setting of the DF flag in the EFLAGS register. (If the DF flag is 0, the (E)SI and (E)DI register are incremented; if the DF flag is 1, the (E)SI and (E)DI registers are decremented.) The registers are incremented or decremented by 1 for byte operations, by 2 for word operations, or by 4 for doubleword operations. 4
  838. The CMPSB, CMPSW, and CMPSD instructions can be preceded by the REP prefix for block comparisons of ECX bytes, words, or doublewords. More often, however, these instructions will be used in a LOOP construct that takes some action based on the setting of the status flags before the next comparison is made. 
  839. Please note that NASM does not support the CMPS instruction. It does however support the CMPSB, CMPSW and CMPSD versions of the instruction. '
  840.  Flags affected
  841. The CF, OF, SF, ZF, AF, and PF flags are set according to the temporary result of the comparison. C
  842.  Instruction size and timings
  843.  variations    bytes   8088    186     286     386     486     Pentium
  844.  cmpsb          1      30      22       8      10       8       5   NP
  845.  cmpsw          1      -       -        -      10       8       5   NP
  846.  cmpsd          1      -       -        -      10       8       5   NP
  847.  repX cmpsb     2      9+30n   5+22n   5+9n    5+9n    7+7n*   9+4n NP
  848.  repX cmpsw     2      9+30n   5+22n   5+9n    5+9n    7+7n*   9+4n NP
  849.  repX cmpsd     2       -       -       -      5+9n    7+7n*   9+4n NP
  850.  repX = repe, repz, repne or repnz
  851.  * : 5 if n = 0
  852.  Example
  853.  repne cmpsb        ; Repeat compare until operands are not equal
  854. contents
  855. screen
  856.  CMPXCHG - Compare and exchange (486+)
  857.  Description
  858. Compares the value in the AL, AX, or EAX register (depending on the size of the operand) with the first operand (destination operand). If the two values are equal, the second operand (source operand) is loaded into the destination operand. Otherwise, the destination operand is loaded into the AL, AX, or EAX register. '
  859.  Flags affected
  860. The ZF flag is set if the values in the destination operand and register AL, AX, or EAX are equal; otherwise it is cleared. The CF, PF, AF, SF, and OF flags are set according to the results of the comparison operation. C
  861.  Instruction size and timings
  862.  operands        bytes                           486     Pentium
  863.  reg, reg         3                               6       5   NP
  864.  mem, reg       3+d(0-2)                         7-10     6   NP
  865.  Example
  866.  cmpxchg ebx, edx   ; Compare and exchange ebx and edx
  867. contents
  868. screen
  869.  CMPXCHG8B - Compare and exchange 8 bytes (Pentium+)
  870.  Description
  871. Compares the 64-bit value in EDX:EAX with the operand (destination operand). If the values are equal, the 64-bit value in ECX:EBX is stored in the destination operand. Otherwise, the value in the destination operand is loaded into EDX:EAX. The destination operand is an 8-byte memory location. For the EDX:EAX and ECX:EBX register pairs, EDX and ECX contain the high-order 32 bits and EAX and EBX contain the low-order 32 bits of a 64-bit value. '
  872.  Flags affected
  873. The ZF flag is set if the destination operand and EDX:EAX are equal; otherwise it is cleared. The CF, PF, AF, SF, and OF flags are unaffected. C
  874.  Instruction size and timings
  875.  operands      bytes                                   Pentium
  876.  mem, reg     3+d(0-2)                                 10   NP
  877.  Example
  878.  cmpxchg8b [ebx], edx   ; Compare and exchange ebx and edx
  879. contents
  880. screen
  881.  CPUID - CPU identification (486+)
  882.  Description
  883. Provides processor identification information in registers EAX, EBX, ECX, and EDX. This information identifies the vendor, family, model, and stepping of the processor, feature information, and cache information. 
  884. Note that only later versions of 486 processors support the CPUID instruction. The CPUID instruction officially became available on Pentium processors. e
  885. An input value loaded into the EAX register determines what information is returned as shown below. K
  886.  Initial
  887.    EAX          Information Provided about the Processor
  888.   Value
  889.     0           EAX  Maximum CPUID Input Value (2 for the Pentium 
  890.                      processor and 1 for the Pentium processor and the later
  891.                      versions of 486 class processors that support the
  892.                      CPUID instruction).
  893.                 EBX, ECX and EDX contain a vendor name, e.g.
  894.                      "GenuineIntel" for Intel processors
  895.                      "AuthenticAMD" for AMD processors
  896.                      "CyrixInstead" for Cyrix processors
  897.                      "UMCUMCUMCUMC" for UMC processors
  898.     1           EAX  Version Information (Type, Family, Model, and Stepping ID)
  899.                 EBX  Reserved
  900.                 ECX  Reserved
  901.                 EDX  Feature Information
  902.     2           EAX  Cache and TLB Information
  903.                 EBX  Cache and TLB Information
  904.                 ECX  Cache and TLB Information
  905.                 EDX  Cache and TLB Information
  906. Bit 21 of the EFLAGS register can be used to determine if the CPUID instruction is supported by the processor. \
  907. The following information details the contents of the registers for the CPUID instruction. &
  908.  Calling CPUID with EAX = 1 returns:
  909.          EAX[3:0]       <- Stepping ID
  910.          EAX[7:4]       <- Model
  911.          EAX[11:8]      <- Family
  912.                                  ; 3 - 386 family
  913.                                  ; 4 - 486 family
  914.                                  ; 5 - Pentium family
  915.                                  ; 6 - Pentium Pro family
  916.          EAX[15:12]     <- Reserved
  917.                                  ; 0 - Original OEM processor
  918.                                  ; 1 - OverDrive
  919.                                  ; 2 - Dual Processor
  920.          Note: Pentium chips have pin CPUTYPE which defines which socket the
  921.                CPU is located in. For example: if the chip is in the first
  922.                socket AX = 0245h, however in the second socket it would
  923.                equal 2425h
  924.          EAX[31:16]     <- Reserved and set to zeros
  925.          EDX            <- Compability flags (a bit is set if a feature
  926.                            is supported by the CPU)
  927.          EDX[0]         <- FPU : FPU on Chip
  928.          EDX[1]         <- VME : Virtual Mode Extension present
  929.          EDX[2]         <- DE  : Debbuging Extentions
  930.          EDX[3]         <- PSE : CPU supports 4MB size pages
  931.          EDX[4]         <- TSC : TSC present (see RDTSC opcode)
  932.          EDX[5]         <- MSR : CPU has Pentium Compatible MSRs
  933.          EDX[6]         <- PAE : Physical Address Extension
  934.          EDX[7]         <- MCE : Machine Check Exception
  935.          EDX[8]         <- CX8 : Supports the CMPXCHG8B instruction
  936.          EDX[9]         <- APIC: Local APIC on Chip (Intel)
  937.                            PGE : Page Global Extension (AMD K5)
  938.          EDX[10]        <- Reserved
  939.          EDX[11]        <- Reserved
  940.          EDX[12]        <- MTRR: CPU supports Memory Type Range Register
  941.                                  (MTRR)
  942.          EDX[13]        <- PGE : Page Global Feature support
  943.          EDX[14]        <- MCA : Machine Check Architecture
  944.          EDX[15]        <- CMOV: CPU supports CMOVcc instruction
  945.          EDX[22..16]    <- Reserved
  946.          EDX[23]        <- MMX : CPU supports IA MMX
  947.          EDX[31:24]     <- Reserved and set to zeros
  948.  Calling CPUID with EAX = 2 returns (Pentium Pro+):
  949.          AL = 1     (Pentium Pro)
  950.          The remainder of EAX and EBX, ECX and EDX contain bytes which
  951.          described cache architecture on the chip.
  952.          Value         Description
  953.          00h           None
  954.          01h           Instruction TLB, 4K page, 4 way, 64 entry
  955.          02h           Instruction TLB, 4M page, 4 way, 4 entry
  956.          03h           Data TLB, 4K page, 4 way, 64 entry
  957.          04h           Data TLB, 4M page, 4 way, 8 entry
  958.          06h           Instruction Cache, 8K, 4 way, 32 bytes per line
  959.          0Ah           Data cache, 8K, 2 way, 32 bytes per line
  960.          41h           Unified cache, 32 bytes per line, 4 way, 128KB
  961.          42h           Unified cache, 32 bytes per line, 4 way, 256KB
  962.          43h           Unified cache, 32 bytes per line, 4 way, 512KB
  963.  Flags affected
  964. None. C
  965.  Instruction size and timings
  966.  bytes                                           Pentium
  967.   2                                              14   NP
  968.  Example
  969.  cpuid          ; Get CPU information
  970. contents
  971. screen
  972.  CWD - Convert word to doubleword
  973.  Description
  974. Extends sign of word in register AX throughout register DX forming a doubleword quantity in DX:AX. '
  975.  Flags affected
  976. None. C
  977.  Instruction size and timings
  978.  bytes   8088    186     286     386     486     Pentium
  979.   1       5       4       2       2       3       2   NP
  980.  Example
  981.  cwd            ; Convert word in AX to doubleword in DX:AX
  982. contents
  983. screen
  984.  CWDE - Convert word to extended doubleword (386+)
  985.  Description
  986. Converts a signed word in AX to a signed doubleword in EAX by extending the sign bit of AX throughout EAX. '
  987.  Flags affected
  988. None. C
  989.  Instruction size and timings
  990.  bytes                           386     486     Pentium
  991.   1                               3       3       3   NP
  992.  Example
  993.  cwde           ; Convert word in AX to doubleword in EAX
  994. contents
  995. screen
  996.  DAA - Decimal adjust AL after addition
  997.  Description
  998. Adjusts the sum of two packed BCD values to create a packed BCD result. The AL register is the implied source and destination operand. The DAA instruction is only useful when it follows an ADD instruction that adds (binary addition) two 2-digit, packed BCD values and stores a byte result in the AL register. The DAA instruction then adjusts the contents of the AL register to contain the correct 2-digit, packed BCD result. If a decimal carry is detected, the CF and AF flags are set accordingly. '
  999.  Flags affected
  1000. The CF and AF flags are set if the adjustment of the value results in a decimal carry in either digit of the result (see above). The SF, ZF, and PF flags are set according to the result. The OF flag is undefined. C
  1001.  Instruction size and timings
  1002.  bytes   8088    186     286     386     486     Pentium
  1003.   1       4       4       3       4       2       3   NP
  1004.  Example
  1005.  add al, bx     ; Before: AL=79H BL=35H EFLAGS(OSZAPC)=XXXXXX
  1006.                 ; After : AL=AEH BL=35H EFLAGS(0SZAPC)=110000
  1007.  daa            ; Before: AL=AEH BL=35H EFLAGS(OSZAPC)=110000
  1008.                 ; After : AL=14H BL=35H EFLAGS(0SZAPC)=X00111
  1009. contents
  1010. screen
  1011.  DAS - Decimal adjust AL after subtraction
  1012.  Description
  1013. Adjusts the result of the subtraction of two packed BCD values to create a packed BCD result. The AL register is the implied source and destination operand. The DAS instruction is only useful when it follows a SUB instruction that subtracts (binary subtraction) one 2-digit, packed BCD value from another and stores a byte result in the AL register. The DAS instruction then adjusts the contents of the AL register to contain the correct 2-digit, packed BCD result. If a decimal borrow is detected, the CF and AF flags are set accordingly. '
  1014.  Flags affected
  1015. The CF and AF flags are set if the adjustment of the value results in a decimal borrow in either digit of the result (see above). The SF, ZF, and PF flags are set according to the result. The OF flag is undefined. C
  1016.  Instruction size and timings
  1017.  bytes   8088    186     286     386     486     Pentium
  1018.   1       4       4       3       4       2       3   NP
  1019.  Example
  1020.  sub al, bl     ; Before: AL=35H BL=47H EFLAGS(OSZAPC)=XXXXXX
  1021.                 ; After : AL=EEH BL=47H EFLAGS(0SZAPC)=010111
  1022.  das            ; Before: AL=EEH BL=47H EFLAGS(OSZAPC)=010111
  1023.                 ; After : AL=88H BL=47H EFLAGS(0SZAPC)=X10111
  1024. contents
  1025. screen 
  1026.  DEC - Decrement
  1027.  Description
  1028. Subtracts 1 from the destination operand, while preserving the state of the CF flag. The destina-tion operand can be a register or a memory location. This instruction allows a loop counter to be updated without disturbing the CF flag. (To perform a decrement operation that updates the CF flag, use a SUB instruction with an immediate operand of 1.) '
  1029.  Flags affected
  1030. The CF flag is not affected. The OF, SF, ZF, AF, and PF flags are set according to the result. C
  1031.  Instruction size and timings
  1032.  operand     bytes   8088    186     286     386     486     Pentium
  1033.  r8           2       3       3       2       2       1       1   UV
  1034.  r16          1       3       3       2       2       1       1   UV
  1035.  r32          1       3       3       2       2       1       1   UV
  1036.  mem       2+d(0,2)  23+EA   15       7       6       3       3   UV
  1037.  Example
  1038.  dec eax        ; Subtract one from eax (eax = eax - 1)
  1039. contents
  1040. screen
  1041.  DIV - Unsigned divide
  1042.  Description
  1043. Divides (unsigned) the value in the AX register, DX:AX register pair, or EDX:EAX register pair (dividend) by the source operand (divisor) and stores the result in the AX (AH:AL), DX:AX, or EDX:EAX registers. The source operand can be a general-purpose register or a memory location. The action of this instruction depends on the operand size, as shown in the following table: 
  1044.  Operand Size     Dividend    Divisor    Quotient    Remainder    Maximum
  1045.                                                                   Quotient
  1046.  Word/byte        AX          r/m8       AL          AH           255
  1047.  Doubleword/
  1048.  word             DX:AX       r/m16      AX          DX           65,535
  1049.  Quadword/
  1050.  doubleword       EDX:EAX     r/m32      EAX         EDX          2^32 - 1
  1051. Non-integral results are truncated towards 0. The remainder is always less than the divisor in magnitude. '
  1052.  Flags affected
  1053. The CF flag is not affected. The OF, SF, ZF, AF, and PF flags are set according to the result. C
  1054.  Instruction size and timings
  1055.  operand     bytes   8088    186     286     386     486     Pentium
  1056.  r8           2     80-90     29     14      14      16      17   NP
  1057.  r16          2    144-162    38     22      22      24      25   NP
  1058.  r32          2       -       -       -      38      40      41   NP
  1059.  mem8    2+d(0-2)   86-96+EA  35     17      17      16      17   NP
  1060.  mem16   2+d(0-2)  150-168+EA 44     25      25      24      25   NP
  1061.  mem32   2+d(0-2)     -       -       -      41      40      41   NP
  1062.  Example
  1063.  div ebx        ; divide EDX:EAX by EBX
  1064. contents
  1065. screen
  1066.  EMMS - Empty MMX state (MMX)
  1067.  Description
  1068. Sets the values of all the tags in the FPU tag word to empty (all ones). This operation marks the MMX registers as available, so they can subsequently be used by floating-point instructions. All other MMX instructions (other than the EMMS instruction) set all the tags in FPU tag word to valid (all zeros). 
  1069. The EMMS instruction must be used to clear the MMX state at the end of all MMX routines and before calling other procedures or subroutines that may execute floating-point instructions. If a floating-point instruction loads one of the registers in the FPU register stack before the FPU tag word has been reset by the EMMS instruction, a floating-point stack overflow can occur that will result in a floating-point exception or incorrect result. '
  1070.  Flags affected
  1071. None. C
  1072.  Instruction size and timings
  1073. Not available. 
  1074.  Example
  1075.  emms           ; Set the FP tag word to empty
  1076. contents
  1077. screen
  1078.  ENTER - Make stack frame for parameters (186+)
  1079.  Description
  1080. Creates a stack frame for a procedure. The first operand (size operand) specifies the size of the stack frame (that is, the number of bytes of dynamic storage allocated on the stack for the procedure). The second operand (nesting level operand) gives the lexical nesting level (0 to 31) of the procedure. The nesting level determines the number of stack frame pointers that are copied into the "display area" of the new stack frame from the preceding frame. Both of these operands are immediate values. 
  1081. The stack-size attribute determines whether the BP (16 bits) or EBP (32 bits) register specifies the current frame pointer and whether SP (16 bits) or ESP (32 bits) specifies the stack pointer. j
  1082. The ENTER and companion LEAVE instructions are provided to support block structured languages. The ENTER instruction (when used) is typically the first instruction in a procedure and is used to set up a new stack frame for a procedure. The LEAVE instruction is then used at the end of the procedure (just before the RET instruction) to release the stack frame. 
  1083. If the nesting level is 0, the processor pushes the frame pointer from the EBP register onto the stack, copies the current stack pointer from the ESP register into the EBP register, and loads the ESP register with the current stack-pointer value minus the value in the size operand. For nesting levels of 1 or greater, the processor pushes additional frame pointers on the stack before adjusting the stack pointer. These additional frame pointers provide the called procedure with access points to other nested frames on the stack. '
  1084.  Flags affected
  1085. None. C
  1086.  Instruction size and timings
  1087.  operands     bytes   8088    186     286     386     486     Pentium
  1088.  imm16, 0       3      -      15      11      10      14      11   NP
  1089.  imm16, 1       4      -      25      15      12      17      15   NP
  1090.  imm16, imm8    4      -   22+16n    12+4n   15+4n   17+3i  15+2i  NP
  1091.                            n = imm8-1;  i = imm8
  1092.  Example
  1093.  enter 1, 0             ; Create stack frame of 1 byte with 0 nesting levels
  1094. contents
  1095. screen
  1096.  ESC - Escape
  1097.  Description
  1098. Provides access to the data bus for other resident processors. The CPU treats it as a NOP but places memory operand on bus. '
  1099.  Flags affected
  1100. None. C
  1101.  Instruction size and timings
  1102. Not available. 
  1103.  Example
  1104. Not available. 
  1105. contents
  1106. screen
  1107.  HLT - Halt
  1108.  Description
  1109. Stops instruction execution and places the processor in a HALT state. An enabled interrupt, NMI, or a reset will resume execution. If an interrupt (including NMI) is used to resume execution after a HLT instruction, the saved instruction pointer (CS:EIP) points to the instruction following the HLT instruction. 
  1110. The HLT instruction is a privileged instruction. When the processor is running in protected or virtual-8086 mode, the privilege level of a program or procedure must be 0 to execute the HLT instruction. '
  1111.  Flags affected
  1112. None. C
  1113.  Instruction size and timings
  1114.  bytes   8088    186     286     386     486     Pentium
  1115.   1       2       2       2       5       4       4   NP
  1116.  Example
  1117.  hlt            ; Enter halt state
  1118. contents
  1119. screen
  1120.  IDIV - Signed divide
  1121.  Description
  1122. Divides (signed) the value in the AL, AX, or EAX register by the source operand and stores the result in the AX, DX:AX, or EDX:EAX registers. The source operand can be a general-purpose register or a memory location. ^
  1123. The action of this instruction depends on the operand size, as shown in the following table: 
  1124.  Operand      Dividend    Divisor    Quotient  Remainder  Quotient
  1125.  Size                                                     Range
  1126.  Word/
  1127.  byte         AX          r/m8       AL        AH         -128 to +127
  1128.  Doubleword/
  1129.  word         DX:AX       r/m16      AX        DX         -32,768 to +32,767
  1130.  Quadword/
  1131.  doubleword   EDX:EAX     r/m32      EAX       EDX        -2^31 to 2^32 - 1
  1132. Non-integral results are truncated towards 0. The sign of the remainder is always the same as the sign of the dividend. The absolute value of the remainder is always less than the absolute value of the divisor. '
  1133.  Flags affected
  1134. The CF, OF, SF, ZF, AF, and PF flags are undefined. C
  1135.  Instruction size and timings
  1136.  operand    bytes    8088      186    286    386    486     Pentium
  1137.  r8          2     101-112    44-52   17     19     19      22   NP
  1138.  r16         2     165-184    53-61   25     27     27      30   NP
  1139.  r32         2       -          -      -     43     43      46   NP
  1140.  mem8   2+d(0-2)  107-118+EA  50-58   20     22     20      22   NP
  1141.  mem16  2+d(0-2)  171-190+EA  59-67   28     30     28      30   NP
  1142.  mem32  2+d(0-2)     -          -      -     46     44      46   NP
  1143.  Example
  1144.  idiv ebx       ; Signed divide EAX by EBX
  1145. contents
  1146. screen
  1147.  IMUL - Signed multiply
  1148.  Description
  1149. Performs a signed multiplication of two operands. This instruction has three forms, depending on the number of operands. 
  1150.  One-operand form
  1151. This form is identical to that used by the MUL instruction. Here, the source operand (in a general-purpose register or memory location) is multiplied by the value in the AL, AX, or EAX register (depending on the operand size) and the product is stored in the AX, DX:AX, or EDX:EAX registers, respectively. 
  1152.  Two-operand form (286+)
  1153. With this form the destination operand (the first operand) is multiplied by the source operand (second operand). The destination operand is a general-purpose register and the source operand is an immediate value, a general-purpose register (386+), or a memory location (386+). The product is then stored in the destination operand location. 
  1154.  Three-operand form (286+)
  1155. This form requires a destination operand (the first operand) and two source operands (the second and the third operands). Here, the first source operand (which can be a general-purpose register or a memory location) is multiplied by the second source operand (an immediate value). The product is then stored in the destination operand (a general-purpose register). u
  1156. When an immediate value is used as an operand, it is sign-extended to the length of the destination operand format. 
  1157. The CF and OF flags are set when significant bits are carried into the upper half of the result. The CF and OF flags are cleared when the result fits exactly in the lower half of the result. 
  1158. The three forms of the IMUL instruction are similar in that the length of the product is calculated to twice the length of the operands. With the one-operand form, the product is stored exactly in the destination. With the two- and three- operand forms, however, the result is truncated to the length of the destination before it is stored in the destination register. Because of this truncation, the CF or OF flag should be tested to ensure that no significant bits are lost. 
  1159. The two- and three-operand forms may also be used with unsigned operands because the lower half of the product is the same regardless if the operands are signed or unsigned. The CF and OF flags, however, cannot be used to determine if the upper half of the result is non-zero. '
  1160.  Flags affected
  1161. For the one operand form of the instruction, the CF and OF flags are set when significant bits are carried into the upper half of the result and cleared when the result fits exactly in the lower half of the result. For the two- and three-operand forms of the instruction, the CF and OF flags are set when the result must be truncated to fit in the destination operand size and cleared when the result fits exactly in the destination operand size. The SF, ZF, AF, and PF flags are undefined. C
  1162.  Instruction size and timings
  1163.  One-operand form
  1164.  operand    bytes   8088     186    286     386     486     Pentium
  1165.  r8          2      80-98    25-28  13      9-14    13-18   11   NP
  1166.  r16         2     128-154   34-37  21      9-22    13-26   11   NP
  1167.  r32         2       -        -      -      9-38    13-42   10   NP
  1168.  mem8    2+d(0-2)  86-104+EA 32-34  16     12-17    13-18   11   NP
  1169.  mem16   2+d(0-2) 134-160+EA 40-43  24     12-25    13-26   11   NP
  1170.  mem32   2+d(0-2)    -        -      -     12-41    13-42   10   NP
  1171.  Two- and three-operand form
  1172.  operands       bytes     186   286    386         486      Pentium
  1173.  r16, imm      2+i(1,2)    -    21  9-14/9-22  13-18/13-26  10   NP
  1174.  r32, imm      2+i(1,2)    -     -     9-38       13-42     10   NP
  1175.  r16,r16,imm   2+i(1,2)  22/29  21  9-14/9-22  13-18/13-26  10   NP
  1176.  r32,r32,imm   2+i(1,2)    -     -     9-38       13-42     10   NP
  1177.  r16,m16,imm   2+d(0-2)  25/32  24 12-17/12-25 13-18/13-26  10   NP
  1178.                 +i(1,2)
  1179.  r32,m32,imm   2+d(0-2)+i(1,2)   -    12-41       13-42     10   NP
  1180.  r16, r16      2+i(1,2)    -     -     9-22    13-18/13-26  10   NP
  1181.  r32, r32      2+i(1,2)    -     -     9-38       13-42     10   NP
  1182.  r16, m16      2+d(0-2)+i(1,2)   -    12-25    13-18/13-26  10   NP
  1183.  r32, m32      2+d(0-2)+i(1,2)   -    12-41       13-42     10   NP
  1184.  Example
  1185.  imul ebx               ; EDX:EAX = EAX * EBX
  1186.  imul ecx, ebx          ; ECX = ECX * EBX
  1187.  imul ecx, ebx, 10      ; ECX = EBX * 10
  1188. contents
  1189. screen
  1190.  IN - Input from port
  1191.  Description
  1192. Copies the value from the I/O port specified with the second operand (source operand) to the destination operand (first operand). The source operand can be a byte-immediate or the DX register; the destination operand can be register AL, AX, or EAX, depending on the size of the port being accessed (8, 16, or 32 bits, respectively). Using the DX register as a source operand allows I/O port addresses from 0 to 65,535 to be accessed; using a byte immediate allows I/O port addresses 0 to 255 to be accessed. 
  1193. When accessing an 8-bit I/O port, the opcode determines the port size; when accessing a 16- and 32-bit I/O port, the operand-size attribute determines the port size. 
  1194. At the machine code level, I/O instructions are shorter when accessing 8-bit I/O ports. Here, the upper eight bits of the port address will be 0. '
  1195.  Flags affected
  1196. None. C
  1197.  Instruction size and timings
  1198.  operands    bytes   8088    186     286     386     486     Pentium
  1199.  al, imm8     2      14      10       5      12      14       7   NP
  1200.  ax, imm8     2      14      10       5      12      14       7   NP
  1201.  eax, imm8    2       -       -       -      12      14       7   NP
  1202.  al, dx       1      12       8       5      13      14       7   NP
  1203.  ax, dx       1      12       8       5      13      14       7   NP
  1204.  eax, dx      1       -       -       -      13      14       7   NP
  1205.                              Protected mode
  1206.  operands     bytes                           386     486     Pentium
  1207.  acc, imm      2                           6/26/26  9/29/27  4/21/19 NP
  1208.  acc, dx       1                           7/27/27  8/28/27  4/21/19 NP
  1209.  Cycles for: CPL <= IOPL / CPL > IOPL / V86
  1210.  Example
  1211.  in  al, dx     ; AL = the value read from I/O port number DX
  1212. contents
  1213. screen
  1214.  INC - Increment
  1215.  Description
  1216. Adds 1 to the destination operand, while preserving the state of the CF flag. # The destination operand can be a register or a memory location. This instruction allows a loop counter to be updated without disturbing the CF flag. (Use a ADD instruction with an immediate operand of 1 to perform an increment operation that does updates the CF flag.) '
  1217.  Flags affected
  1218. The CF flag is not affected. The OF, SF, ZF, AF, and PF flags are set according to the result. C
  1219.  Instruction size and timings
  1220.  operand     bytes   8088    186     286     386     486     Pentium
  1221.  r8           2       3       3       2       2       1       1   UV
  1222.  r16          1       3       3       2       2       1       1   UV
  1223.  r32          1       3       3       2       2       1       1   UV
  1224.  mem       2+d(0,2)  23+EA   15       7       6       3       3   UV
  1225.  Example
  1226.  inc ebx        ; EBX = EBX + 1
  1227. contents
  1228. screen
  1229.  INS - Input from port to string (186+)
  1230.  Description
  1231. Copies the data from the I/O port specified with the source operand (second operand) to the destination operand (first operand). The source operand is an I/O port address (from 0 to 65,535) that is read from the DX register. The destination operand is a memory location, the address of which is read from either the ES:EDI or the ES:DI registers (depending on the address-size attribute of the instruction, 32 or 16, respectively). (The ES segment cannot be overridden with a segment override prefix.) 
  1232. The size of the I/O port being accessed (that is, the size of the source and destination operands) is determined by the opcode for an 8-bit I/O port or by the operand-size attribute of the instruction for a 16- or 32-bit I/O port. ?
  1233. At the assembly-code level, two forms of this instruction are allowed: the "explicit-operands" form and the "no-operands" form. The explicit-operands form (specified with the INS mnemonic) allows the source and destination operands to be specified explicitly. This version of the instruction is NOT supported by NASM. ]
  1234. The no-operands form provides "short forms" of the byte, word, and doubleword versions of the INS instructions. Here also DX is assumed by the processor to be the source operand and ES:(E)DI is assumed to be the destination operand. The size of the I/O port is specified with the choice of mnemonic: INSB (byte), INSW (word), or INSD (doubleword). 
  1235. After the byte, word, or doubleword is transferred from the I/O port to the memory location, the (E)DI register is incremented or decremented automatically according to the setting of the DF flag in the EFLAGS register. (If the DF flag is 0, the (E)DI register is incremented; if the DF flag is 1, the (E)DI register is decremented.) The (E)DI register is incremented or decremented by 1 for byte operations, by 2 for word operations, or by 4 for doubleword operations. 
  1236. The INSB, INSW, and INSD instructions can be preceded by the REP prefix for block input of ECX bytes, words, or doublewords. See REP/REPE/REPZ/REPNE/REPNZ for a description of the REP prefix. '
  1237.  Flags affected
  1238. None. C
  1239.  Instruction size and timings
  1240.  variations  bytes   8088    186     286     386     486     Pentium
  1241.  insb         1       -      14       5      15      17      9    NP
  1242.  insw         1       -      14       5      15      17      9    NP
  1243.  insd         1       -       -       -      15      17      9    NP
  1244.  Protected Mode
  1245.              bytes                           386     486     Pentium
  1246.               1                           9/29/29 10/32/30 6/24/22 NP
  1247.  Cycles for: CPL <= IOPL / CPL > IOPL / V86
  1248.  Example
  1249.  rep insb       ; Repeatedly input bytes from the port specified by DX
  1250. contents
  1251. screen
  1252.  INT - Call interrupt procedure
  1253.  Description
  1254. The INT n instruction generates a call to the interrupt or exception handler specified with the destination operand. The destination operand specifies an interrupt vector number from 0 to 255, encoded as an 8-bit unsigned intermediate value. Each interrupt vector number provides an index to a gate descriptor in the IDT. The first 32 interrupt vector numbers are reserved by Intel for system use. Some of these interrupts are used for internally generated exceptions. 
  1255. The INT n instruction is the general mnemonic for executing a software-generated call to an interrupt handler. The INTO instruction is a special mnemonic for calling overflow exception interrupt vector number 4. 
  1256. The INT 3 instruction generates a special one byte opcode (CC) that is intended for calling the debug exception handler. (This one byte form is valuable because it can be used to replace the first byte of any instruction with a breakpoint, including other one byte instructions, without overwriting other code). To further support its function as a debug breakpoint, the interrupt generated with the CC opcode also differs from the regular software interrupts as follows: 
  1257. Note that the "normal" 2-byte opcode for INT 3 (CD03) does not have these special features. Intel and Microsoft assemblers will not generate the CD03 opcode from any mnemonic, but this opcode can be created by direct numeric code definition or by self-modifying code. 
  1258. The action of the INT n instruction (including the INTO and INT 3 instructions) is similar to that of a far call made with the CALL instruction. The primary difference is that with the INT n instruction, the EFLAGS register is pushed onto the stack before the return address. (The return address is a far address consisting of the current values of the CS and EIP registers.) Returns from interrupt procedures are handled with the IRET instruction, which pops the EFLAGS information and return address from the stack. 
  1259. The interrupt vector number specifies an interrupt descriptor in the interrupt descriptor table (IDT); that is, it provides index into the IDT. The selected interrupt descriptor in turn contains a pointer to an interrupt or exception handler procedure. In protected mode, the IDT contains an array of 8-byte descriptors, each of which is an interrupt gate, trap gate, or task gate. In real-address mode, the IDT is an array of 4-byte far pointers (2-byte code segment selector and a 2-byte instruction pointer), each of which point directly to a procedure in the selected segment. (Note that in real-address mode, the IDT is called the interrupt vector table, and it's pointers are called interrupt vectors.) '
  1260.  Flags affected
  1261. The EFLAGS register is pushed onto the stack. The IF, TF, NT, AC, RF, and VM flags may be cleared, depending on the mode of operation of the processor when the INT instruction is executed. If the interrupt uses a task gate, any flags may be set or cleared, controlled by the EFLAGS image in the new task's TSS. C
  1262.  Instruction size and timings
  1263.  operands  bytes   8088    186     286     386     486     Pentium
  1264.    3        1      72      45      23+m    33      26      13   NP
  1265.    imm8     2      71      47      23+m    37      30      16   NP
  1266.                              Protected mode
  1267.    bytes   8088    186     286     386     486     Pentium
  1268.     1      -       -     (40-78)+m 59-99   44-71  27-82 NP
  1269.  Example
  1270.  int 21h        ; Call DOS services interrupt vector
  1271. contents
  1272. screen
  1273.  INTO - Call interrupt procedure if overflow
  1274.  Description
  1275.  Flags affected
  1276. If the Overflow Flag is set this instruction generates an INT 4 which causes the code addressed by 0000:0010 to be executed. C
  1277.  Instruction size and timings
  1278.  bytes   8088    186     286     386     486     Pentium
  1279.   1      4/73    4/48    3/24+m  3/35    3/28    4/13 NP
  1280.                              Protected mode
  1281.  bytes                   286     386     486     Pentium
  1282.   1                    (40-78)+m 59-99   44-71  27-56 NP
  1283.  Example
  1284.  into           ; Call interrupt 4 if overflow flag is set
  1285. contents
  1286. screen
  1287.  INVD - Invalidate data cache (486+)
  1288.  Description
  1289. Invalidates (flushes) the processor's internal caches and issues a special-function bus cycle that directs external caches to also flush themselves. Data held in internal caches is not written back to main memory. 
  1290. After executing this instruction, the processor does not wait for the external caches to complete their flushing operation before proceeding with instruction execution. It is the responsibility of hardware to respond to the cache flush signal. 
  1291. The INVD instruction is a privileged instruction. When the processor is running in protected mode, the CPL of a program or procedure must be 0 to execute this instruction. g
  1292. Use this instruction with care. Data cached internally and not written back to main memory will be lost. Unless there is a specific requirement or benefit to flushing caches without writing back modified cache lines (for example, testing or fault recovery where cache coherency with main memory is not a concern), software should use the WBINVD instruction. '
  1293.  Flags affected
  1294. None. C
  1295.  Instruction size and timings
  1296.  bytes   8088    186     286     386     486     Pentium
  1297.   2       -       -       -       -       4      15   NP
  1298.  Example
  1299.  invd      ; Invalidate data cache
  1300. contents
  1301. screen
  1302.  INVLPG - Invalidate TLB entry (486+)
  1303.  Description
  1304. Invalidates (flushes) the translation lookaside buffer (TLB) entry specified with the source operand. The source operand is a memory address. The processor determines the page that contains that address and flushes the TLB entry for that page. 
  1305. The INVLPG instruction is a privileged instruction. When the processor is running in protected mode, the CPL of a program or procedure must be 0 to execute this instruction. 
  1306. The INVLPG instruction normally flushes the TLB entry only for the specified page; however, in some cases, it flushes the entire TLB. '
  1307.  Flags affected
  1308. None. C
  1309.  Instruction size and timings
  1310.   operands  bytes                                   486     Pentium
  1311.   mem32      5                                       12      25   NP
  1312.  Example
  1313.  invlpg [eax]   ; Invalidate TLB entry specified by eax
  1314. contents
  1315. screen
  1316.  IRET/IRETD - Interrupt return
  1317.  Description
  1318. Returns control to point of interruption by popping IP, CS and then the EFLAGS from the stack and continues execution at this location.  CPU exception interrupts will return to the instruction that cause the exception because the CS:IP placed on the stack during the interrupt is the address of the offending instruction. '
  1319.  Flags affected
  1320. All the flags and fields in the EFLAGS register are potentially modified, depending on the mode of operation of the processor. If performing a return from a nested task to a previous task, the EFLAGS register will be modified according to the EFLAGS image stored in the previous task's TSS. C
  1321.  Instruction size and timings
  1322.  IRET
  1323.  bytes   8088    186     286     386     486     Pentium
  1324.   1       44      28      17+m    22      15     8-27  NP
  1325.  IRETD (386+)
  1326.  bytes                           386     486     Pentium
  1327.   1                               22      15     10-27  NP
  1328.  Example
  1329.  iret           ; Return from interrupt
  1330. contents
  1331. screen
  1332.  Jcc - Jump on condition
  1333.  Description
  1334. Checks the state of one or more of the status flags in the EFLAGS register (CF, OF, PF, SF, and ZF) and, if the flags are in the specified state (condition), performs a jump to the target instruction specified by the destination operand. A condition code (cc) is associated with each instruction to indicate the condition being tested for. If the condition is not satisfied, the jump is not performed and execution continues with the instruction following the Jcc instruction. ^
  1335. The target instruction is specified with a relative offset (a signed offset relative to the current value of the instruction pointer in the EIP register). A relative offset (rel8, rel16, or rel32) is generally specified as a label in assembly code, but at the machine code level, it is encoded as a signed, 8-bit or 32-bit immediate value, which is added to the instruction pointer. Instruction coding is most efficient for offsets of -128 to +127. If the operand-size attribute is 16, the upper two bytes of the EIP register are cleared to 0s, resulting in a maximum instruction pointer size of 16 bits. 
  1336. The conditions for each Jcc mnemonic are given in the "Description" column of the table below. The terms "less" and "greater" are used for comparisons of signed integers and the terms "above" and "below" are used for unsigned integers. 
  1337. Because a particular state of the status flags can sometimes be interpreted in two ways, two mnemonics are defined for some opcodes. For example, the JA (jump if above) instruction and the JNBE (jump if not below or equal) instruction are alternate mnemonics for the opcode. 
  1338. The Jcc instruction does not support far jumps (jumps to other code segments). When the target for the conditional jump is in a different segment, use the opposite condition from the condition being tested for the Jcc instruction, and then access the target with an unconditional far jump (JMP instruction) to the other segment. For example, the following conditional far jump is illegal: !
  1339.         jz FARLABEL  ; Far jump
  1340. To accomplish this far jump, use the following two instructions: `
  1341.         jnz BEYOND   ; If not zero skip far jump
  1342.         jmp FARLABEL ; Unconditional far jump
  1343.         BEYOND:      ; Label
  1344. The JECXZ and JCXZ instructions differs from the other Jcc instructions because they do not check the status flags. Instead they check the contents of the ECX and CX registers, respectively, for 0. Either the CX or ECX register is chosen according to the address-size attribute. These instructions are useful at the beginning of a conditional loop that terminates with a conditional loop instruction (such as LOOPNE). They prevent entering the loop when the ECX or CX register is equal to 0, which would cause the loop to execute 2^32 or 64K times, respectively, instead of zero times. |
  1345. All conditional jumps are converted to code fetches of one or two cache lines, regardless of jump address or cacheability. 
  1346.  Jump Instructions Table
  1347.  Mnemonic    Meaning                    Jump Condition
  1348.  JA          Jump if Above                         CF=0 and ZF=0
  1349.  JAE         Jump if Above or Equal                CF=0
  1350.  JB          Jump if Below                         CF=1
  1351.  JBE         Jump if Below or Equal                CF=1 or ZF=1
  1352.  JC          Jump if Carry                         CF=1
  1353.  JCXZ        Jump if CX Zero                       CX=0
  1354.  JE          Jump if Equal                         ZF=1
  1355.  JG          Jump if Greater (signed)              ZF=0 and SF=OF
  1356.  JGE         Jump if Greater or Equal (signed)     SF=OF
  1357.  JL          Jump if Less (signed)                 SF != OF
  1358.  JLE         Jump if Less or Equal (signed)        ZF=1 or SF != OF
  1359.  JMP         Unconditional Jump                    unconditional
  1360.  JNA         Jump if Not Above                     CF=1 or ZF=1
  1361.  JNAE        Jump if Not Above or Equal            CF=1
  1362.  JNB         Jump if Not Below                     CF=0
  1363.  JNBE        Jump if Not Below or Equal            CF=0 and ZF=0
  1364.  JNC         Jump if Not Carry                     CF=0
  1365.  JNE         Jump if Not Equal                     ZF=0
  1366.  JNG         Jump if Not Greater (signed)          ZF=1 or SF != OF
  1367.  JNGE        Jump if Not Greater or Equal (signed) SF != OF
  1368.  JNL         Jump if Not Less (signed)             SF=OF
  1369.  JNLE        Jump if Not Less or Equal (signed)    ZF=0 and SF=OF
  1370.  JNO         Jump if Not Overflow (signed)         OF=0
  1371.  JNP         Jump if No Parity                     PF=0
  1372.  JNS         Jump if Not Signed (signed)           SF=0
  1373.  JNZ         Jump if Not Zero                      ZF=0
  1374.  JO          Jump if Overflow (signed)             OF=1
  1375.  JP          Jump if Parity                        PF=1
  1376.  JPE         Jump if Parity Even                   PF=1
  1377.  JPO         Jump if Parity Odd                    PF=0
  1378.  JS          Jump if Signed (signed)               SF=1
  1379.  JZ          Jump if Zero                          ZF=1
  1380.  Flags affected
  1381. None. C
  1382.  Instruction size and timings
  1383.  operand     bytes   8088    186     286     386     486     Pentium
  1384.  near8        2      4/16    4/13    3/7+m   3/7+m   1/3     1    PV
  1385.  near16       3       -       -       -      3/7+m   1/3     1    PV
  1386.  Note: Cycles shown for no jump/jump
  1387.  JCXZ / JECXZ
  1388.  operand    bytes   8088    186     286     386     486     Pentium
  1389.  dest        2      6/18    5/16    4/8+m   5/9+m   5/8     5/6  NP
  1390.  dest        2       -       -       -      5/9+m   5/8     5/6  NP
  1391.  Example
  1392.  jne not_equal  ; Jump to label 'not_equal' if not equal condition is met
  1393.  jcxz cx_zero   ; Jump to label 'cx_zero' if the CX register is zero
  1394. contents
  1395. screen
  1396.  JMP - Unconditional jump
  1397.  Description
  1398. Transfers program control to a different point in the instruction stream without recording return information. The destination (target) operand specifies the address of the instruction being jumped to. This operand can be an immediate value, a general-purpose register, or a memory location. H
  1399. This instruction can be used to execute four different types of jumps: 
  1400.  Near jump
  1401. A jump to an instruction within the current code segment (the segment currently pointed to by the CS register), sometimes referred to as an intrasegment jump. 
  1402.  Short jump
  1403. A near jump where the jump range is limited to -128 to +127 from the current EIP value. 
  1404.  Far jump
  1405. A jump to an instruction located in a different segment than the current code segment but at the same privilege level, sometimes referred to as an intersegment jump. 
  1406.  Task switch
  1407. A jump to an instruction located in a different task. A task switch can only be executed in protected mode. 
  1408.  Near and Short Jumps
  1409. When executing a near jump, the processor jumps to the address (within the current code segment) that is specified with the target operand. The target operand specifies either an absolute offset (that is an offset from the base of the code segment) or a relative offset (a signed displacement relative to the current value of the instruction pointer in the EIP register). A near jump to a relative offset of 8-bits (rel8) is referred to as a short jump. The CS register is not changed on near and short jumps. 
  1410. An absolute offset is specified indirectly in a general-purpose register or a memory location (r/m16 or r/m32). The operand-size attribute determines the size of the target operand (16 or 32 bits). Absolute offsets are loaded directly into the EIP register. If the operand-size attribute is 16, the upper two bytes of the EIP register are cleared to 0s, resulting in a maximum instruction pointer size of 16 bits. 
  1411. A relative offset (rel8, rel 16, or rel32) is generally specified as a label in assembly code. This value is added to the value in the EIP register. (Here, the EIP register contains the address of the instruction following the JMP instruction). When using relative offsets, the opcode (for short vs. near jumps) and the operand-size attribute (for near relative jumps) determines the size of the target operand (8, 16, or 32 bits). 3
  1412.  Far Jumps in Real-Address or Virtual-8086 Mode
  1413. When executing a far jump in real-address or virtual-8086 mode, the processor jumps to the code segment and offset specified with the target operand. Here the target operand specifies an absolute far address either directly with a pointer (ptr16:16 or ptr16:32) or indirectly with a memory location (m16:16 or m16:32). With the pointer method, the segment and address of the called procedure is encoded in the instruc-tion, using a 4-byte (16-bit operand size) or 6-byte (32-bit operand size) far address immediate. With the indirect method, the target operand specifies a memory location that contains a 4-byte (16-bit operand size) or 6-byte (32-bit operand size) far address. The far address is loaded directly into the CS and EIP registers. If the operand-size attribute is 16, the upper two bytes of the EIP register are cleared to 0s.  
  1414.  Far Jumps in Protected Mode
  1415. When the processor is operating in protected mode, the JMP instruction can be used to perform the following three types of far jumps: w
  1416.   - A far jump to a conforming or non-conforming code segment.
  1417.   - A far jump through a call gate.
  1418.   - A task switch.
  1419. (The JMP instruction cannot be used to perform interprivilege level far jumps.) 
  1420. In protected mode, the processor always uses the segment selector part of the far address to access the corresponding descriptor in the GDT or LDT. The descriptor type (code segment, call gate, task gate, or TSS) and access rights determine the type of jump to be performed. H
  1421. If the selected descriptor is for a code segment, a far jump to a code segment at the same privilege level is performed. (If the selected code segment is at a different privilege level and the code segment is non-conforming, a general-protection exception is generated.) A far jump to the same privilege level in protected mode is very similar to one carried out in real-address or virtual-8086 mode. The target operand specifies an absolute far address either directly with a pointer (ptr16:16 or ptr16:32) or indirectly with a memory location (m16:16 or m16:32). The operand-size attribute determines the size of the offset (16 or 32 bits) in the far address. The new code segment selector and its descriptor are loaded into CS register, and the offset from the instruction is loaded into the EIP register. Note that a call gate (described in the next paragraph) can also be used to perform far call to a code segment at the same privilege level. Using this mechanism provides an extra level of indirection and is the preferred method of making jumps between 16- bit and 32-bit code segments. '
  1422.  Flags affected
  1423. All flags are affected if a task switch occurs; no flags are affected if a task switch does not occur. C
  1424.  Instruction size and timings
  1425.  operand     bytes   8088    186     286     386     486     Pentium
  1426.  short        2      15      13      7+m     7+m      3       1   PV
  1427.  near         3      15      13      7+m     7+m      3       1   PV
  1428.  far          5      15      13     11+m    12+m     17       3   NP
  1429.  r16          2      11      11      7+m     7+m      5       2   NP
  1430.  mem16      2+d(0,2) 18+EA   17     11+m    10+m      5       2   NP
  1431.  mem32      2+d(4)   24+EA   26     15+m    12+m     13       4   NP
  1432.  r32          2       -       -       -      7+m      5       2   NP
  1433.  mem32      2+d(0,2)  -       -       -     10+m      5       2   NP
  1434.  mem48      2+d(6)    -       -       -     12+m     13       4   NP
  1435.  Example
  1436.  jmp target_address     ; Unconditional jump to target_address
  1437. contents
  1438. screen
  1439.  LAHF - Load status flags into AH register
  1440.  Description
  1441. Moves the low byte of the EFLAGS register (which includes status flags SF, ZF, AF, PF, and CF) to the AH register. Reserved bits 1, 3, and 5 of the EFLAGS register are set in the AH register. '
  1442.  Flags affected
  1443. None (that is, the state of the flags in the EFLAGS register are not affected). C
  1444.  Instruction size and timings
  1445.  bytes   8088    186     286     386     486     Pentium
  1446.   1       4       2       2       2       3       2   NP
  1447.  Example
  1448.  lahf      ; Load flags into AH
  1449. contents
  1450. screen
  1451.  LAR - Load access rights byte (286+)
  1452.  Description
  1453. Loads the access rights from the segment descriptor specified by the second operand (source operand) into the first operand (destination operand) and sets the ZF flag in the EFLAGS register. The source operand (which can be a register or a memory location) contains the segment selector for the segment descriptor being accessed. The destination operand is a general-purpose register. 
  1454. The processor performs access checks as part of the loading process. Once loaded in the destination register, software can perform additional checks on the access rights information. M
  1455. When the operand size is 32 bits, the access rights for a segment descriptor include the type and DPL fields and the S, P, AVL, D/B, and G flags, all of which are located in the second double-word (bytes 4 through 7) of the segment descriptor. The doubleword is masked by 00FXFF00H before it is loaded into the destination operand. 
  1456. When the operand size is 16 bits, the access rights include the type and DPL fields. Here, the two lower-order bytes of the doubleword are masked by FF00H before being loaded into the destination operand. o
  1457. This instruction performs the following checks before it loads the access rights in the destination register: 2
  1458.  Checks that the segment selector is not null.
  1459.  Checks that the segment selector points to a descriptor that is within the
  1460.    limits of the GDT or LDT being accessed
  1461.  Checks that the descriptor type is valid for this instruction. All code and
  1462.    data segment descriptors are valid for (can be accessed with) the LAR
  1463.    instruction. The valid system segment and gate descriptor types are given
  1464.    in the following table.
  1465.  If the segment is not a conforming code segment, it checks that the specified
  1466.    segment descriptor is visible at the CPL (that is, if the CPL and the RPL of
  1467.    the segment selector are less than or equal to the DPL of the segment
  1468.    selector).
  1469. If the segment descriptor cannot be accessed or is an invalid type for the instruction, the ZF flag is cleared and no access rights are loaded in the destination operand. The LAR instruction can only be executed in protected mode. +
  1470.  Type               Name                    Valid
  1471.  0                  Reserved                No
  1472.  1                  Available 16-bit TSS    Yes
  1473.  2                  LDT                     Yes
  1474.  3                  Busy 16-bit TSS         Yes
  1475.  4                  16-bit call gate        Yes
  1476.  5                  16-bit/32-bit task gate Yes
  1477.  6                  16-bit interrupt gate   No
  1478.  7                  16-bit trap gate        No
  1479.  8                  Reserved                No
  1480.  9                  Available 32-bit TSS    Yes
  1481.  A                  Reserved                No
  1482.  B                  Busy 32-bit TSS         Yes
  1483.  C                  32-bit call gate        Yes
  1484.  D                  Reserved                No
  1485.  E                  32-bit interrupt gate   No
  1486.  F                  32-bit trap gate        No
  1487.  Flags affected
  1488. The ZF flag is set to 1 if the access rights are loaded successfully; otherwise, it is cleared to 0. C
  1489.  Instruction size and timings
  1490.  operands    bytes                   286     386     486     Pentium
  1491.  r16, r16     3                      14      15      11       8   NP
  1492.  r32, r32     3                       -      15      11       8   NP
  1493.  r16, m16     3                      16      16      11       8   NP
  1494.  r32, m32     3                       -      16      11       8   NP
  1495.  Example
  1496.  lar ebx, eax           ; EBX = access rights descriptor specified by EAX
  1497. contents
  1498. screen
  1499.  LDS/LES/LFS/LGS/LSS - Load far pointer
  1500.  Description
  1501. Loads a far pointer (segment selector and offset) from the second operand (source operand) into a segment register and the first operand (destination operand). The source operand specifies a 48-bit or a 32-bit pointer in memory depending on the current setting of the operand-size attribute (32 bits or 16 bits, respectively). The instruction opcode and the destination operand specify a segment register/general-purpose register pair. The 16-bit segment selector from the source operand is loaded into the segment register specified with the opcode (DS, SS, ES, FS, or GS). The 32-bit or 16-bit offset is loaded into the register specified with the destination operand. 
  1502. If one of these instructions is executed in protected mode, additional information from the segment descriptor pointed to by the segment selector in the source operand is loaded in the hidden part of the selected segment register. ]
  1503. Also in protected mode, a null selector (values 0000 through 0003) can be loaded into DS, ES, FS, or GS registers without causing a protection exception. (Any subsequent reference to a segment whose corresponding segment register is loaded with a null selector, causes a general-protection exception and no memory reference to the segment occurs.) '
  1504.  Flags affected
  1505. None. C
  1506.  Instruction size and timings
  1507.  LDS/LES
  1508.  operands    bytes   8088    186     286     386     486     Pentium
  1509.  reg, mem   2+d(2)   24+EA   18       7       7       6       4   NP
  1510.  LFS/LGS/LSS (386+)
  1511.  operands    bytes                           386     486     Pentium
  1512.  reg, mem   3+d(2,4)                          7       6       4   NP
  1513.  Example
  1514.  lds si, ptr_1          ; DS:DI points to ptr_1
  1515. contents
  1516. screen
  1517.  LEA - Load effective address
  1518.  Description
  1519. Computes the effective address of the second operand (the source operand) and stores it in the first operand (destination operand). The source operand is a memory address (offset part) specified with one of the processors addressing modes; the destination operand is a general-purpose register. The address-size and operand-size attributes affect the action performed by this instruction, as shown in the following table. The operand-size attribute of the instruction is determined by the chosen register; the address-size attribute is determined by the attribute of the code segment. :
  1520.  Operand   Address      Action Performed
  1521.  Size      Size
  1522.  16        16           16-bit effective address is calculated and stored in
  1523.                         requested 16-bit register destination.
  1524.  16        32           32-bit effective address is calculated. The lower 16
  1525.                         bits of the address are stored in the requested 16-bit
  1526.                         register destination.
  1527.  32        16           16-bit effective address is calculated. The 16-bit
  1528.                         address is zero-extended and stored in the requested
  1529.                         32-bit register destination.
  1530.  32        32           32-bit effective address is calculated and stored in
  1531.                         the requested 32-bit register destination.
  1532.  Flags affected
  1533. None. C
  1534.  Instruction size and timings
  1535.  operands    bytes   8088    186     286     386     486     Pentium
  1536.  r16, mem    2+d(2)  2+EA     6       3       2      1-2      1   UV
  1537.  r32, mem    2+d(2)   -       -       -       2      1-2      1   UV
  1538.  Example
  1539.  lea  eax, [eax+ebx*2+3]       ; EAX = effective address of [eax+ebx*2+3]
  1540. contents
  1541. screen
  1542.  LEAVE - High level procedure exit (186+)
  1543.  Description
  1544. Releases the stack frame set up by an earlier ENTER instruction. The LEAVE instruction copies the frame pointer (in the EBP register) into the stack pointer register (ESP), which releases the stack space allocated to the stack frame. The old frame pointer (the frame pointer for the calling procedure that was saved by the ENTER instruction) is then popped from the stack into the EBP register, restoring the calling procedure's stack frame. z
  1545. A RET instruction is commonly executed following a LEAVE instruction to return program control to the calling procedure. '
  1546.  Flags affected
  1547. None. C
  1548.  Instruction size and timings
  1549.   bytes           186     286     386     486     Pentium
  1550.    1               8       5       4       5       3   NP
  1551.  Example
  1552.  leave     ; Exit current procedure
  1553. contents
  1554. screen
  1555.  LGDT/LIDT - Load Global/Interrupt Descriptor Table Register (286+)
  1556.  Description
  1557. Loads the values in the source operand into the global descriptor table register (GDTR) or the interrupt descriptor table register (IDTR). The source operand specifies a 6-byte memory location that contains the base address (a linear address) and the limit (size of table in bytes) of the global descriptor table (GDT) or the interrupt descriptor table (IDT). If operand-size attribute is 32 bits, a 16-bit limit (lower 2 bytes of the 6-byte data operand) and a 32-bit base address (upper 4 bytes of the data operand) are loaded into the register. If the operand-size attribute is 16 bits, a 16-bit limit (lower 2 bytes) and a 24-bit base address (third, fourth, and fifth byte) are loaded. Here, the high-order byte of the operand is not used and the high-order byte of the base address in the GDTR or IDTR is filled with zeros. {
  1558. The LGDT and LIDT instructions are used only in operating-system software; they are not used in application programs. They are the only instructions that directly load a linear address (that is, not a segment-relative address) and a limit in protected mode. They are commonly executed in real-address mode to allow processor initialization prior to switching to protected mode. '
  1559.  Flags affected
  1560. None. C
  1561.  Instruction size and timings
  1562.  operand     bytes                   286     386     486     Pentium
  1563.   mem48       5                      11      11      11       6   NP
  1564.  Example
  1565.  lgdt descriptor[ebx]   ; Load Global Descriptor Table
  1566. contents
  1567. screen
  1568.  LLDT - Load Local Descriptor Table register (286+)
  1569.  Description
  1570. Loads the source operand into the segment selector field of the local descriptor table register (LDTR). The source operand (a general-purpose register or a memory location) contains a segment selector that points to a local descriptor table (LDT). After the segment selector is loaded in the LDTR, the processor uses to segment selector to locate the segment descriptor for the LDT in the global descriptor table (GDT). It then loads the segment limit and base address for the LDT from the segment descriptor into the LDTR. 
  1571. The segment registers DS, ES, SS, FS, GS, and CS are not affected by this instruction, nor is the LDTR field in the task state segment (TSS) for the current task. 
  1572. If the source operand is 0, the LDTR is marked invalid and all references to descriptors in the LDT (except by the LAR, VERR, VERW or LSL instructions) cause a general protection exception. ?
  1573. The operand-size attribute has no effect on this instruction. 
  1574. The LLDT instruction is provided for use in operating-system software; it should not be used in application programs. Also, this instruction can only be executed in protected mode. '
  1575.  Flags affected
  1576. None. C
  1577.  Instruction size and timings
  1578.  operand     bytes                   286     386     486     Pentium
  1579.   r16         3                      17      20      11       9   NP
  1580.   mem16     3+d(0-2)                 19      24      11       9   NP
  1581.  Example
  1582.  lldt ax        ; Load LDT with AX
  1583. contents
  1584. screen
  1585.  LMSW - Load Machine Status Word (286+)
  1586.  Description
  1587. Loads the source operand into the machine status word, bits 0 through 15 of register CR0. The source operand can be a 16-bit general-purpose register or a memory location. Only the low-order 4 bits of the source operand (which contains the PE, MP, EM, and TS flags) are loaded into CR0. The PG, CD, NW, AM, WP, NE, and ET flags of CR0 are not affected. The operand-size attribute has no effect on this instruction. 
  1588. If the PE flag of the source operand (bit 0) is set to 1, the instruction causes the processor to switch to protected mode. While in protected mode, the LMSW instruction cannot be used clear the PE flag and force a switch back to real-address mode. 
  1589. The LMSW instruction is provided for use in operating-system software; it should not be used in application programs. In protected or virtual-8086 mode, it can only be executed at CPL 0. 
  1590. This instruction is provided for compatibility with the Intel 286 processor; programs and procedures intended to run on the Pentium Pro, Pentium, 486, and 386 processors should use the MOV (control registers) instruction to load the whole CR0 register. The MOV CR0 instruction can be used to set and clear the PE flag in CR0, allowing a procedure or program to switch between protected and real-address modes. 0
  1591. This instruction is a serializing instruction. '
  1592.  Flags affected
  1593. None. C
  1594.  Instruction size and timings
  1595.  operand     bytes                   286     386     486     Pentium
  1596.   r16         3                       3      10      13       8   NP
  1597.   mem16     3+d(0-2)                  6      13      13       8   NP
  1598.  Example
  1599.  lmsw ax     ; load machine status word with ax
  1600. contents
  1601. screen
  1602.  LOCK - Lock bus
  1603.  Description
  1604. Causes the processor's LOCK# signal to be asserted during execution of the accompanying instruction (turns the instruction into an atomic instruction). In a multiprocessor environment, the LOCK# signal insures that the processor has exclusive use of any shared memory while the signal is asserted. 
  1605. Note that in later Intel Architecture processors (such as the Pentium Pro processor), locking may occur without the LOCK# signal being asserted. 
  1606. The LOCK prefix can be prepended only to the following instructions and to those forms of the instructions that use a memory operand: ADD, ADC, AND, BTC, BTR, BTS, CMPXCHG, DEC, INC, NEG, NOT, OR, SBB, SUB, XOR, XADD, and XCHG. An undefined opcode exception will be generated if the LOCK prefix is used with any other instruction. The XCHG instruction always asserts the LOCK# signal regardless of the presence or absence of the LOCK prefix. 
  1607. The LOCK prefix is typically used with the BTS instruction to perform a read-modify-write operation on a memory location in shared memory environment. 
  1608. The integrity of the LOCK prefix is not affected by the alignment of the memory field. Memory locking is observed for arbitrarily misaligned fields. "
  1609. Intel Architecture Compatibility 
  1610. Beginning with the Pentium Pro processor, when the LOCK prefix is prefixed to an instruction and the memory area being accessed is cached internally in the processor, the LOCK# signal is generally not asserted. Instead, only the processor's cache is locked. Here, the processor's cache coherency mechanism insures that the operation is carried out atomically with regards to memory. '
  1611.  Flags affected
  1612. None. C
  1613.  Instruction size and timings
  1614.  bytes   8088    186     286     386     486     Pentium
  1615.   1       2       2       0       0       1       1   NP
  1616.  Example
  1617.  lock  mov mem, 1       ; Lock the bus while performing a memory move
  1618. contents
  1619. screen
  1620.  LODS - Load string
  1621.  Description
  1622. Loads a byte, word, or doubleword from the source operand into the AL, AX, or EAX register, respectively. The source operand is a memory location, the address of which is read from the DS:EDI or the DS:SI registers (depending on the address-size attribute of the instruction, 32 or 16, respectively). The DS segment may be overridden with a segment override prefix. 
  1623. At the assembly-code level, two forms of this instruction are allowed: the "explicit-operands" form and the "no-operands" form. The explicit-operands form (specified with the LODS mnemonic) is not supported by NASM. 
  1624. The no-operands form provides "short forms" of the byte, word, and doubleword versions of the LODS instructions. Here also DS:(E)SI is assumed to be the source operand and the AL, AX, or EAX register is assumed to be the destination operand. The size of the source and destination operands is selected with the mnemonic: LODSB (byte loaded into register AL), LODSW (word loaded into AX), or LODSD (doubleword loaded into EAX). 
  1625. After the byte, word, or doubleword is transferred from the memory location into the AL, AX, or EAX register, the (E)SI register is incremented or decremented automatically according to the setting of the DF flag in the EFLAGS register. (If the DF flag is 0, the (E)SI register is incremented; if the DF flag is 1, the ESI register is decremented.) The (E)SI register is incremented or decremented by 1 for byte operations, by 2 for word operations, or by 4 for doubleword operations. 
  1626. The LODSB, LODSW, and LODSD instructions can be preceded by the REP prefix for block loads of ECX bytes, words, or doublewords. More often, however, these instructions are used within a LOOP construct because further processing of the data moved into the register is usually necessary before the next transfer can be made. See REP/REPE/REPZ/REPNE/REPNZ for more information on the repeat prefix. '
  1627.  Flags affected
  1628. None. C
  1629.  Instruction size and timings
  1630.  variations  bytes   8088    186     286     386     486     Pentium
  1631.  lodsb        1      16      10       5       5       5       2   NP
  1632.  lodsw        1      16      10       5       5       5       2   NP
  1633.  lodsd        1       -       -       -       5       5       2   NP
  1634.  Example
  1635.  lodsb     ; Move the byte from DS:SI into AL
  1636. contents
  1637. screen
  1638.  LOOP - Decrement CX and loop if CX not zero
  1639.  Description
  1640. Performs a loop operation using the ECX or CX register as a counter. Each time the LOOP instruction is executed, the count register is decremented, then checked for 0. If the count is 0, the loop is terminated and program execution continues with the instruction following the LOOP instruction. If the count is not zero, a near jump is performed to the destination (target) operand, which is presumably the instruction at the beginning of the loop. If the address-size attribute is 32 bits, the ECX register is used as the count register; otherwise the CX register is used. 
  1641. The target instruction is specified with a relative offset (a signed offset relative to the current value of the instruction pointer in the EIP register). This offset is generally specified as a label in assembly code, but at the machine code level, it is encoded as a signed, 8-bit immediate value, which is added to the instruction pointer. Offsets of -128 to +127 are allowed with this instruction. '
  1642.  Flags affected
  1643. None. C
  1644.  Instruction size and timings
  1645.  operand   bytes   8088    186     286     386     486     Pentium
  1646.  short      2      5/17    5/15    4/8+m   11+m    6/7     5/6  NP
  1647.  Note: timings shown for no jump (CX = 0) / jump (CX <> 0)
  1648.  Example
  1649.  loop loop_start        ; If CX <> 0 then loop to 'loop_start'
  1650. contents
  1651. screen
  1652.  LOOPE/LOOPZ - Loop while equal / loop while zero
  1653.  Description
  1654. Loops in the same way as the LOOP instruction except that the loop occurs only when (E)CX <> 0 and the zero flag (ZF) is set. '
  1655.  Flags affected
  1656. None. C
  1657.  Instruction size and timings
  1658.  operand   bytes   8088    186     286     386     486     Pentium
  1659.  short      2      6/18    5/16    4/8     11+m    6/9     7/8  NP
  1660.  Example
  1661.  loope loop_start             ; Loop if CX <> 0 and ZF = 1
  1662. contents
  1663. screen
  1664.  LOOPNE/LOOPNZ - Loop while not equal / loop while not zero
  1665.  Description
  1666. Loops in the same way as the LOOP instruction except that the loop occurs only when (E)CX <> 0 and the zero flag (ZF) is not set. '
  1667.  Flags affected
  1668. None. C
  1669.  Instruction size and timings
  1670.  operand bytes   8088    186     286     386     486     Pentium
  1671.  short    2      5/19    5/16    4/8     11+m    6/9     7/8  NP
  1672.  Example
  1673.  loopne loop_start      ; Loop if CX <> 0 and ZF = 0
  1674. contents
  1675. screen
  1676.  LSL - Load segment limit (286+)
  1677.  Description
  1678. Loads the unscrambled segment limit from the segment descriptor specified with the second operand (source operand) into the first operand (destination operand) and sets the ZF flag in the EFLAGS register. The source operand (which can be a register or a memory location) contains the segment selector for the segment descriptor being accessed. The destination operand is a general-purpose register. 
  1679. The processor performs access checks as part of the loading process. Once loaded in the destination register, software can compare the segment limit with the offset of a pointer.  
  1680. The segment limit is a 20-bit value contained in bytes 0 and 1 and in the first 4 bits of byte 6 of the segment descriptor. If the descriptor has a byte granular segment limit (the granularity flag is set to 0), the destination operand is loaded with a byte granular value (byte limit). [
  1681. If the descriptor has a page granular segment limit (the granularity flag is set to 1), the LSL instruction will translate the page granular limit (page limit) into a byte limit before loading it into the destination operand. The translation is performed by shifting the 20-bit "raw" limit left 12 bits and filling the low-order 12 bits with 1s. 
  1682. When the operand size is 32 bits, the 32-bit byte limit is stored in the destination operand. When the operand size is 16 bits, a valid 32-bit limit is computed; however, the upper 16 bits are truncated and only the low-order 16 bits are loaded into the destination operand. q
  1683. This instruction performs the following checks before it loads the segment limit into the destination register: X
  1684.  Checks that the segment selector is not null.
  1685.  Checks that the segment selector points to a descriptor that is within
  1686.    the limits of the GDT or LDT being accessed
  1687.  Checks that the descriptor type is valid for this instruction. All code
  1688.    and data segment descriptors are valid for (can be accessed with) the LSL
  1689.    instruction.
  1690.  If the segment is not a conforming code segment, the instruction checks
  1691.    that the specified segment descriptor is visible at the CPL (that is, if
  1692.    the CPL and the RPL of the segment selector are less than or equal to the
  1693.    DPL of the segment selector).
  1694. If the segment descriptor cannot be accessed or is an invalid type for the instruction, the ZF flag is cleared and no value is loaded in the destination operand. '
  1695.  Flags affected
  1696. The ZF flag is set to 1 if the segment limit is loaded successfully; otherwise, it is cleared to 0. C
  1697.  Instruction size and timings
  1698.  operands    bytes                   286     386     486     Pentium
  1699.  r16, r16     3                      14      20/25   10       8   NP
  1700.  r32, r32     3                       -      20/25   10       8
  1701.  r16, m16   3+d(0,2)                 16      21/26   10       8
  1702.  r32, m32   3+d(0,2)                  -      21/26   10       8
  1703.  Example
  1704.  lsl eax, ebx           ; Load segment limit of EBX and store in EAX
  1705. contents
  1706. screen
  1707.  LTR - Load task register (286+)
  1708.  Description
  1709. Loads the source operand into the segment selector field of the task register. The source operand (a general-purpose register or a memory location) contains a segment selector that points to a task state segment (TSS). After the segment selector is loaded in the task register, the processor uses the segment selector to locate the segment descriptor for the TSS in the global descriptor table (GDT). It then loads the segment limit and base address for the TSS from the segment descriptor into the task register. The task pointed to by the task register is marked busy, but a switch to the task does not occur. 
  1710. The LTR instruction is provided for use in operating-system software; it should not be used in application programs. It can only be executed in protected mode when the CPL is 0. It is commonly used in initialization code to establish the first task to be executed. ?
  1711. The operand-size attribute has no effect on this instruction. '
  1712.  Flags affected
  1713. None. C
  1714.  Instruction size and timings
  1715.  operand     bytes                   286     386     486     Pentium
  1716.  r16          3                      17      23      20      10   NP
  1717.  mem16      3+d(0,2)                 19      27      20      10
  1718.  Example
  1719.  ltr ax         ; Load task register from AX
  1720. contents
  1721. screen
  1722.  MOV - Move data
  1723.  Description
  1724. Copies the second operand (source operand) to the first operand (destination operand). The source operand can be an immediate value, general-purpose register, segment register, or memory location; the destination register can be a general-purpose register, segment register, or memory location. Both operands must be the same size, which can be a byte, a word, or a doubleword. 
  1725. The MOV instruction cannot be used to load the CS register. Attempting to do so results in an invalid opcode exception. To load the CS register, use the far JMP, CALL, or RET instruction. 3
  1726. If the destination operand is a segment register (DS, ES, FS, GS, or SS), the source operand must be a valid segment selector. In protected mode, moving a segment selector into a segment register automatically causes the segment descriptor information associated with that segment selector to be loaded into the hidden (shadow) part of the segment register. While loading this information, the segment selector and segment descriptor information is validated. The segment descriptor data is obtained from the GDT or LDT entry for the specified segment selector. F
  1727. A null segment selector (values 0000-0003) can be loaded into the DS, ES, FS, and GS registers without causing a protection exception. However, any subsequent attempt to reference a segment whose corresponding segment register is loaded with a null value causes a general protection exception and no memory reference occurs. q
  1728. Loading the SS register with a MOV instruction inhibits all interrupts until after the execution of the next instruction. This operation allows a stack pointer to be loaded into the ESP register with the next instruction (MOV ESP, stack-pointer value) before an interrupt occurs. The LSS instruction offers a more efficient method of loading the SS and ESP registers. 
  1729. When operating in 32-bit mode and moving data between a segment register and a general-purpose register, the Intel Architecture 32-bit processors do not require the use of the 16-bit operand-size prefix (a byte with the value 66H) with this instruction, but most assemblers will insert it if the standard form of the instruction is used (for example, MOV DS, AX). The processor will execute this instruction correctly, but it will usually require an extra clock. With most assemblers, using the instruction form MOV DS, EAX will avoid this unneeded 66H prefix. When the processor executes the instruction with a 32-bit general-purpose register, it assumes that the 16 least-significant bits of the general-purpose register are the destination or source operand. If the register is a destination operand, the resulting value in the two high-order bytes of the register is implementation dependent. 
  1730. For the PentiumPro processor, the two high-order bytes are filled with zeros; for earlier 32-bit Intel Architecture processors, the two high order bytes are undefined. '
  1731.  Flags affected
  1732. None. C
  1733.  Instruction size and timings
  1734.  operands    bytes   8088    186     286     386     486     Pentium
  1735.  reg, reg     2       2       2       2       2       1       1   UV
  1736.  mem, reg  2+d(0-2)  13+EA    9       3       2       1       1   UV
  1737.  reg, mem  2+d(0-2)  12+EA   12       5       4       1       1   UV
  1738.  mem, imm  2+d(0-2)  14+EA   12-13    3       2       1       1   UV*
  1739.             +i(1,2)
  1740.  reg, imm  2+i(1,2)   4       3-4     2       2       1       1   UV
  1741.  acc, mem     3      14       8       5       4       1       1   UV
  1742.  mem, acc     3      14       9       3       2       1       1   UV
  1743.  * = not pairable if there is a displacement and immediate
  1744.  Segment Register Moves  - Real Mode
  1745.  operands    bytes   8088    186     286     386     486     Pentium
  1746.  seg, r16     2       2       2       2       2       3     2-11   NP
  1747.  seg, m16   2+d(0,2) 12+EA    9       5       5       3     3-12   NP
  1748.  r16, seg     2       2       2       2       2       3       1    NP
  1749.  m16, seg   2+d(0,2) 13+EA   11       3       2       3       1    NP
  1750.  Segment Register Moves - Protected Mode
  1751.  operands    bytes                   286     386     486     Pentium
  1752.  seg, r16     2                      17      18       9     2-11*  NP
  1753.  seg, m16   2+d(0,2)                 19      19       9     3-12*  NP
  1754.  * = add 8 if new descriptor; add 6 if SS
  1755.  Move to/from special registers (386+)
  1756.  operands    bytes                           386     486     Pentium
  1757.  r32, cr32    3                               6       4       4    NP
  1758.  cr32, r32    3                              4/10*   4/16*  12/22* NP
  1759.  r32, dr32    3                              14/22*  10      2/12* NP
  1760.  dr32, r32    3                              16/22*  11     11/12* NP
  1761.  r32, tr32    3                              12      3/4*     -    NP
  1762.  tr32, r32    3                              12      4/6*     -    NP
  1763.  * = cycles depend on which special register
  1764.  Example
  1765.  mov eax, ebx           ; EAX = EBX (General move)
  1766.  mov ds, ax             ; DS = AX   (Segment register move)
  1767.  mov cr0, eax           ; CR0 = EAX (Special register move)
  1768. contents
  1769. screen
  1770.  MOVD - Move 32 bits (MMX)
  1771.  Description
  1772. Copies doubleword from the source operand (second operand) to the destination operand (first operand). Source and destination operands can be MMX registers, memory locations, or 32-bit general-purpose registers; however, data cannot be transferred from an MMX register to an MMX register, from one memory location to another memory location, or from one general-purpose register to another general-purpose register. q
  1773. When the destination operand is an MMX register, the 32-bit source value is written to the low-order 32 bits of the 64-bit MMX register and zero-extended to 64 bits. When the source operand is an MMX register, the low-order 32 bits of the MMX register are written to the 32-bit general-purpose register or 32-bit memory location selected with the destination operand. '
  1774.  Flags affected
  1775. None. C
  1776.  Instruction size and timings
  1777. Not available. 
  1778.  Example
  1779. Not available. 
  1780. contents
  1781. screen
  1782.  MOVQ - Move 64 bits (MMX)
  1783.  Description
  1784. Copies quadword from the source operand (second operand) to the destination operand (first operand). A source or destination operand can be either an MMX register or a memory location; however, data cannot be transferred from one memory location to another memory location. Data can be transferred from one MMX register to another MMX register. '
  1785.  Flags affected
  1786. None. C
  1787.  Instruction size and timings
  1788. Not available. 
  1789.  Example
  1790. Not available. 
  1791. contents
  1792. screen
  1793.  MOVS/MOVSB/MOVSW/MOVSD - Move string
  1794.  Description
  1795. Moves the byte, word, or doubleword specified with the second operand (source operand) to the location specified with the first operand (destination operand). Both the source and destination operands are located in memory. The address of the source operand is read from the DS:ESI or the DS:SI registers (depending on the address-size attribute of the instruction, 32 or 16, respectively). The address of the destination operand is read from the ES:EDI or the ES:DI registers (again depending on the address-size attribute of the instruction). k
  1796. The DS segment may be overridden with a segment override prefix, but the ES segment cannot be overridden. 
  1797. At the assembly-code level, two forms of this instruction are allowed: the "explicit-operands" form and the "no-operands" form. The explicit-operands form (specified with the MOVS mnemonic) is not supported by NASM. h
  1798. The no-operands form provides "short forms" of the byte, word, and doubleword versions of the MOVS instructions. Here also DS:(E)SI and ES:(E)DI are assumed to be the source and destination operands, respectively. The size of the source and destination operands is selected with the mnemonic: MOVSB (byte move), MOVSW (word move), or MOVSD (doubleword move). 
  1799. After the move operation, the (E)SI and (E)DI registers are incremented or decremented automatically according to the setting of the DF flag in the EFLAGS register. (If the DF flag is 0, the (E)SI and (E)DI register are incremented; if the DF flag is 1, the (E)SI and (E)DI registers are decremented.) The registers are incremented or decremented by 1 for byte operations, by 2 for word operations, or by 4 for doubleword operations. 
  1800. The MOVS, MOVSB, MOVSW, and MOVSD instructions can be preceded by the REP prefix for block moves of ECX bytes, words, or doublewords. '
  1801.  Flags affected
  1802. None. C
  1803.  Instruction size and timings
  1804.  variations  bytes   8088    186     286     386     486     Pentium
  1805.  movsb        1      18       9       5       7       7       4   NP
  1806.  movsw        1      26       9       5       7       7       4   NP
  1807.  movsd        1       -       -       -       7       7       4   NP
  1808.  rep movsb    2      9+17n   8+8n    5+4n    7+4n   12+3n*   3+n  NP
  1809.  rep movsw    2      9+25n   8+8n    5+4n    7+4n   12+3n*   3+n  NP
  1810.  rep movsd    2       -       -       -      7+4n   12+3n*   3+n  NP
  1811.  * = 5 if n=0, 13 if n=1 (where n = count of bytes, words or dwords)
  1812.  Example
  1813.  rep movsb              ; Move CX bytes from DS:SI to ES:DI
  1814. contents
  1815. screen
  1816.  MOVSX - Move with sign-extension (386+)
  1817.  Description
  1818. Copies the contents of the source operand (register or memory location) to the destination operand (register) and sign extends the value to 16 or 32 bits. The size of the converted value depends on the operand-size attribute. '
  1819.  Flags affected
  1820. None. C
  1821.  Instruction size and timings
  1822.  operands  bytes                           386     486     Pentium
  1823.  reg, reg   3                               3       3       3   NP
  1824.  reg, mem   3+d(0,1,2,4)                    6       3       3   NP
  1825.  Note: destination register is 16 or 32-bits; source is 8 or 16 bits
  1826.  Example
  1827.  movsx  ebx, ax         ; EBX = sign extended AX
  1828. contents
  1829. screen
  1830.  MOVZX - Move with zero-extend (386+)
  1831.  Description
  1832. Copies the contents of the source operand (register or memory location) to the destination operand (register) and zero extends the value to 16 or 32 bits. The size of the converted value depends on the operand-size attribute. '
  1833.  Flags affected
  1834. None. C
  1835.  Instruction size and timings
  1836.  operands  bytes                           386     486     Pentium
  1837.  reg, reg   3                               3       3       3   NP
  1838.  reg, mem   3+d(0,1,2,4)                    6       3       3   NP
  1839.  Note: destination register is 16 or 32-bits; source is 8 or 16 bits
  1840.  Example
  1841.  movzx ebx, ax          ; EBX = zero extended AX
  1842. contents
  1843. screen
  1844.  MUL - Unsigned multiply
  1845.  Description
  1846. Performs an unsigned multiplication of the first operand (destination operand) and the second operand (source operand) and stores the result in the destination operand. The destination operand is an implied operand located in register AL, AX or EAX (depending on the size of the operand); the source operand is located in a general-purpose register or a memory location. The action of this instruction and the location of the result depends on the opcode and the operand size as shown in the following table. 
  1847.  Operand Size    Source 1     Source 2      Destination
  1848.  Byte            AL           r/m8          AX
  1849.  Word            AX           r/m16         DX:AX
  1850.  Doubleword      EAX          r/m32         EDX:EAX
  1851. The result is stored in register AX, register pair DX:AX, or register pair EDX:EAX (depending on the operand size), with the high-order bits of the product contained in register AH, DX, or EDX, respectively. If the high-order bits of the product are 0, the CF and OF flags are cleared; otherwise, the flags are set. '
  1852.  Flags affected
  1853. The OF and CF flags are cleared to 0 if the upper half of the result is 0; otherwise, they are set to 1. The SF, ZF, AF, and PF flags are undefined. C
  1854.  Instruction size and timings
  1855.  operand     bytes   8088     186    286     386     486     Pentium
  1856.  r8           2     70-77    26-28   13      9-14   13-18    11   NP
  1857.  r16          2    118-133   35-37   21      9-22   13-26    11   NP
  1858.  r32          2       -        -      -      9-38   13-42    10   NP
  1859.  mem8    2+d(0-2)  76-83+EA  32-34   16     12-17   13-18    11   NP
  1860.  mem16   2+d(0-2) 124-139+EA 41-43   24     12-25   13-26    11   NP
  1861.  mem32   2+d(0-2)     -        -      -     12-41   13-42    10   NP
  1862.  Example
  1863.  mul ebx        ; EDX:EAX = EAX * EBX
  1864. contents
  1865. screen
  1866.  NEG - Two's complement negation
  1867.  Description
  1868. Replaces the value of operand (the destination operand) with its two's complement. (This operation is equivalent to subtracting the operand from 0.) The destination operand is located in a general-purpose register or a memory location. '
  1869.  Flags affected
  1870. The CF flag cleared to 0 if the source operand is 0; otherwise it is set to 1. The OF, SF, ZF, AF, and PF flags are set according to the result. C
  1871.  Instruction size and timings
  1872.  operand     bytes   8088    186     286     386     486     Pentium
  1873.  reg          2       3       3       2       2       1       1   NP
  1874.  mem       2+d(0-2)  24+EA   13       7       6       3       3   NP
  1875.  Example
  1876.  neg eax        ; EAX = 0 - EAX
  1877. contents
  1878. screen
  1879.  NOP - No operation
  1880.  Description
  1881. Performs no operation. This instruction is a one-byte instruction that takes up space in the instruction stream but does not affect the machine context, except the EIP register. Q
  1882. The NOP instruction is an alias mnemonic for the XCHG (E)AX, (E)AX instruction. '
  1883.  Flags affected
  1884. None. C
  1885.  Instruction size and timings
  1886.  bytes   8088    186     286     386     486     Pentium
  1887.   1       3       3       3       3       1       1   UV
  1888.  Example
  1889.  nop       ; No operation
  1890. contents
  1891. screen
  1892.  NOT - One's complement negation
  1893.  Description
  1894. Performs a bitwise NOT operation (each 1 is cleared to 0, and each 0 is set to 1) on the destination operand and stores the result in the destination operand location. The destination operand can be a register or a memory location. '
  1895.  Flags affected
  1896. None. C
  1897.  Instruction size and timings
  1898.  operands    bytes   8088    186     286     386     486     Pentium
  1899.  reg          2       3       3       2       2       1       1   NP
  1900.  mem       2+d(0-2)  24+EA   13       7       6       3       3   NP
  1901.  Example
  1902.  not eax        ; Toggle each bit in EAX
  1903. contents
  1904. screen
  1905.  OR - Logical inclusive OR
  1906.  Description
  1907. Performs a bitwise inclusive OR operation between the destination (first) and source (second) operands and stores the result in the destination operand location. The source operand can be an immediate, a register, or a memory location; the destination operand can be a register or a memory location. (However, two memory operands cannot be used in one instruction.) Each bit of the result of the OR instruction is 0 if both corresponding bits of the operands are 0; otherwise, each bit is 1. '
  1908.  Flags affected
  1909. The OF and CF flags are cleared; the SF, ZF, and PF flags are set according to the result. The state of the AF flag is undefined. C
  1910.  Instruction size and timings
  1911.  operands     bytes   8088    186     286     386     486     Pentium
  1912.  reg, reg      2       3       3       2       2       1       1   UV
  1913.  mem, reg   2+d(0,2)  24+EA   10       7       7       3       3   UV
  1914.  reg, mem   2+d(0,2)  13+EA   10       7       6       2       2   UV
  1915.  reg, imm   2+i(1,2)   4       4       3       2       1       1   UV
  1916.  mem, imm   2+d(0,2)  23+EA   16       7       7       3       3   UV*
  1917.              +i(1,2)
  1918.  acc, imm   1+i(1,2)   4       4       3       2       1       1   UV
  1919.  * = not pairable if there is a displacement and immediate
  1920.  Example
  1921.  or eax, ebx    ; Perform logical or storing result in EAX
  1922. contents
  1923. screen
  1924.  OUT - Output to port
  1925.  Description
  1926. Copies the value from the second operand (source operand) to the I/O port specified with the destination operand (first operand). The source operand can be register AL, AX, or EAX, depending on the size of the port being accessed (8, 16, or 32 bits, respectively); the destination operand can be a byte-immediate or the DX register. Using a byte immediate allows I/O port addresses 0 to 255 to be accessed; using the DX register as a source operand allows I/O ports from 0 to 65,535 to be accessed. 
  1927. The size of the I/O port being accessed is determined by the opcode for an 8-bit I/O port or by the operand-size attribute of the instruction for a 16- or 32-bit I/O port. 
  1928. At the machine code level, I/O instructions are shorter when accessing 8-bit I/O ports. Here, the upper eight bits of the port address will be 0. '
  1929.  Flags affected
  1930. None. C
  1931.  Instruction size and timings
  1932.  operands    bytes   8088    186     286     386     486     Pentium
  1933.  imm8, al     2      14       9       3      10      16      12   NP
  1934.  imm8, ax     2      14       9       3      10      16      12   NP
  1935.  imm8, eax    2       -       -       -      10      16      12   NP
  1936.  dx, al       1      12       7       3      11      16      12   NP
  1937.  dx, ax       1      12       7       3      11      16      12   NP
  1938.  dx, eax      1       -       -       -      11      16      12   NP
  1939.  Protected Mode
  1940.  operands    bytes                           386     486     Pentium
  1941.  imm8, acc    2                            4/24/24 11/31/29 9/26/24 NP
  1942.  dx, acc      1                            5/25/25 10/30/29 9/26/24 NP
  1943.  Cycles for: CPL <= IOPL / CPL > IOPL / V86
  1944.  Example
  1945.  out dx, al     ; Send AL to port DX
  1946. contents
  1947. screen
  1948.  OUTS - Output string to port
  1949.  Description
  1950. Copies data from the source operand (second operand) to the I/O port specified with the destination operand (first operand). The source operand is a memory location, the address of which is read from either the DS:EDI or the DS:DI registers (depending on the address-size attribute of the instruction, 32 or 16, respectively). (The DS segment may be overridden with a segment override prefix.) The destination operand is an I/O port address (from 0 to 65,535) that is read from the DX register. The size of the I/O port being accessed (that is, the size of the source and destination operands) is determined by the opcode for an 8-bit I/O port or by the operand-size attribute of the instruction for a 16- or 32-bit I/O port. 
  1951. At the assembly-code level, two forms of this instruction are allowed: the "explicit-operands" form and the "no-operands" form. The explicit-operands form (specified with the OUTS mnemonic) is not supported by NASM. P
  1952. The no-operands form provides "short forms" of the byte, word, and doubleword versions of the OUTS instructions. Here also DS:(E)SI is assumed to be the source operand and DX is assumed to be the destination operand. The size of the I/O port is specified with the choice of mnemonic: OUTSB (byte), OUTSW (word), or OUTSD (doubleword). 
  1953. After the byte, word, or doubleword is transferred from the memory location to the I/O port, the (E)SI register is incremented or decremented automatically according to the setting of the DF flag in the EFLAGS register. (If the DF flag is 0, the (E)SI register is incremented; if the DF flag is 1, the (E)SI register is decremented.) The (E)SI register is incremented or decremented by 1 for byte operations, by 2 for word operations, or by 4 for doubleword operations. 
  1954. The OUTS, OUTSB, OUTSW, and OUTSD instructions can be preceded by the REP prefix for block input of ECX bytes, words, or doublewords. '
  1955.  Flags affected
  1956. None. C
  1957.  Instruction size and timings
  1958.  variations  bytes           186     286     386     486     Pentium
  1959.  outsb        1              14       5      14      17      13   NP
  1960.  outsw        1              14       5      14      17      13   NP
  1961.  outsd        1               -       -      14      17      13   NP
  1962.  Protected Mode
  1963.  bytes                           386     486     Pentium
  1964.   1                           8/28/28 10/32/30 10/27/25 NP
  1965.  Cycles for: CPL <= IOPL / CPL > IOPL / V86
  1966.  Example
  1967.  rep outsb      ; Output CX bytes from DS:DI to port DX
  1968. contents
  1969. screen
  1970.  PACKSSWB/PACKSSDW - Pack with signed saturation (MMX)
  1971.  Description
  1972. Packs and saturates signed words into bytes (PACKSSWB) or signed doublewords into words (PACKSSDW). The PACKSSWB instruction packs 4 signed words from the destination operand (first operand) and 4 signed words from the source operand (second operand) into 8 signed bytes in the destination operand. If the signed value of a word is beyond the range of a signed byte (that is, greater than 7FH or less than 80H), the saturated byte value of 7FH or 80H, respectively, is stored into the destination. 
  1973. The PACKSSDW instruction packs 2 signed doublewords from the destination operand (first operand) and 2 signed doublewords from the source operand (second operand) into 4 signed words in the destination operand. If the signed value of a doubleword is beyond the range of a signed word (that is, greater than 7FFFH or less than 8000H), the saturated word value of 7FFFH or 8000H, respectively, is stored into the destination. 
  1974. The destination operand for either the PACKSSWB or PACKSSDW instruction must be an MMX register; the source operand may be either an MMX register or a quadword memory location. '
  1975.  Flags affected
  1976. None. C
  1977.  Instruction size and timings
  1978. Not available. 
  1979.  Example
  1980. Not available. 
  1981. contents
  1982. screen
  1983.  PACKUSWB - Pack with unsigned saturation (MMX)
  1984.  Description
  1985. Packs and saturates 4 signed words from the destination operand (first operand) and 4 signed words from the source operand (second operand) into 8 unsigned bytes in the destination operand. If the signed value of a word is beyond the range of an unsigned byte (that is, greater than FFH or less than 00H), the saturated byte value of FFH or 00H, respectively, is stored into the destination. 
  1986. The destination operand must be an MMX register; the source operand may be either an MMX register or a quadword memory location. '
  1987.  Flags affected
  1988. None. C
  1989.  Instruction size and timings
  1990. Not available. 
  1991.  Example
  1992. Not available. 
  1993. contents
  1994. screen
  1995.  PADDB/PADDW/PADDD - Packed add (MMX)
  1996.  Description
  1997. Adds the individual data elements (bytes, words, or doublewords) of the source operand (second operand) to the individual data elements of the destination operand (first operand). If the result of an individual addition exceeds the range for the specified data type (overflows), the result is wrapped around, meaning that the result is truncated so that only the lower (least significant) bits of the result are returned (that is, the carry is ignored). 
  1998. The destination operand must be an MMX register; the source operand can be either an MMX register or a quadword memory location. H
  1999. The PADDB instruction adds the bytes of the source operand to the bytes of the destination operand and stores the results to the destination operand. When an individual result is too large to be represented in 8 bits, the lower 8 bits of the result are written to the destination operand and therefore the result wraps around. J
  2000. The PADDW instruction adds the words of the source operand to the words of the destination operand and stores the results to the destination operand. When an individual result is too large to be represented in 16 bits, the lower 16 bits of the result are written to the destination operand and therefore the result wraps around. V
  2001. The PADDD instruction adds the doublewords of the source operand to the doublewords of the destination operand and stores the results to the destination operand. When an individual result is too large to be represented in 32 bits, the lower 32 bits of the result are written to the destination operand and therefore the result wraps around. 
  2002. Note that like the integer ADD instruction, the PADDB, PADDW, and PADDD instructions can operate on either unsigned or signed (two's complement notation) packed integers. Unlike the integer instructions, none of the MMX instructions affect the EFLAGS register. With MMX instructions, there are no carry or overflow flags to indicate when overflow has occurred, so the software must control the range of values or else use the "with saturation" MMX instructions. '
  2003.  Flags affected
  2004. None. C
  2005.  Instruction size and timings
  2006. Not available. 
  2007.  Example
  2008. Not available. 
  2009. contents
  2010. screen
  2011.  PADDSB/PADDSW - Packed add with saturation (MMX)
  2012.  Description
  2013. Adds the individual signed data elements (bytes or words) of the source operand (second operand) to the individual signed data elements of the destination operand (first operand). If the result of an individual addition exceeds the range for the specified data type, the result is saturated. The destination operand must be an MMX register; the source operand can be either an MMX register or a quadword memory location. p
  2014. The PADDSB instruction adds the signed bytes of the source operand to the signed bytes of the destination operand and stores the results to the destination operand. When an individual result is beyond the range of a signed byte (that is, greater than 7FH or less than 80H), the saturated byte value of 7FH or 80H, respectively, is written to the destination operand. x
  2015. The PADDSW instruction adds the signed words of the source operand to the signed words of the destination operand and stores the results to the destination operand. When an individual result is beyond the range of a signed word (that is, greater than 7FFFH or less than 8000H), the saturated word value of 7FFFH or 8000H, respectively, is written to the destination operand. '
  2016.  Flags affected
  2017. None. C
  2018.  Instruction size and timings
  2019. Not available. 
  2020.  Example
  2021. Not available. 
  2022. contents
  2023. screen
  2024.  PADDUSB/PADDUSW - Packed add with unsigned saturation (MMX)
  2025.  Description
  2026. Adds the individual unsigned data elements (bytes or words) of the packed source operand (second operand) to the individual unsigned data elements of the packed destination operand (first operand). If the result of an individual addition exceeds the range for the specified unsigned data type, the result is saturated. The destination operand must be an MMX register; the source operand can be either an MMX register or a quadword memory location. Z
  2027. The PADDUSB instruction adds the unsigned bytes of the source operand to the unsigned bytes of the destination operand and stores the results to the destination operand. When an individual result is beyond the range of an unsigned byte (that is, greater than FFH), the saturated unsigned byte value of FFH is written to the destination operand. ^
  2028. The PADDUSW instruction adds the unsigned words of the source operand to the unsigned words of the destination operand and stores the results to the destination operand. When an individual result is beyond the range of an unsigned word (that is, greater than FFFFH), the saturated unsigned word value of FFFFH is written to the destination operand. '
  2029.  Flags affected
  2030. None. C
  2031.  Instruction size and timings
  2032. Not available. 
  2033.  Example
  2034. Not available. 
  2035. contents
  2036. screen
  2037.  PAND - Logical AND (MMX)
  2038.  Description
  2039. Performs a bitwise logical AND operation on the quadword source (second) and destination (first) operands and stores the result in the destination operand location. The source operand can be an MMX register or a quadword memory location; the destination operand must be an MMX register. Each bit of the result of the PAND instruction is set to 1 if the corresponding bits of the operands are both 1; otherwise it is made zero '
  2040.  Flags affected
  2041. None. C
  2042.  Instruction size and timings
  2043. Not available. 
  2044.  Example
  2045. Not available. 
  2046. contents
  2047. screen
  2048.  PANDN - Logical AND NOT (MMX)
  2049.  Description
  2050. Performs a bitwise logical NOT on the quadword destination operand (first operand). Then, the instruction performs a bitwise logical AND operation on the inverted destination operand and the quadword source operand (second operand). Each bit of the result of the AND operation is set to one if the corresponding bits of the source and inverted destination bits are one; otherwise it is set to zero. The result is stored in the destination operand location. {
  2051. The source operand can be an MMX register or a quadword memory location; the destination operand must be an MMX register. '
  2052.  Flags affected
  2053. None. C
  2054.  Instruction size and timings
  2055. Not available. 
  2056.  Example
  2057. Not available. 
  2058. contents
  2059. screen
  2060.  PCMPEQB/PCMPEQW/PCMPEQD - Packed compare for equal (MMX)
  2061.  Description
  2062. Compares the individual data elements (bytes, words, or doublewords) in the destination operand (first operand) to the corresponding data elements in the source operand (second operand). If a pair of data elements are equal, the corresponding data element in the destination operand is set to all ones; otherwise, it is set to all zeros. The destination operand must be an MMX register; the source operand may be either an MMX register or a 64- bit memory location. 
  2063. The PCMPEQB instruction compares the bytes in the destination operand to the corresponding bytes in the source operand, with the bytes in the destination operand being set according to the results. 
  2064. The PCMPEQW instruction compares the words in the destination operand to the corresponding words in the source operand, with the words in the destination operand being set according to the results. 
  2065. The PCMPEQD instruction compares the doublewords in the destination operand to the corre-sponding doublewords in the source operand, with the doublewords in the destination operand being set according to the results. '
  2066.  Flags affected
  2067. None. C
  2068.  Instruction size and timings
  2069. Not available. 
  2070.  Example
  2071. Not available. 
  2072. contents
  2073. screen
  2074.  PCMPGTB/PCMPGTW/PCMPGTD - Packed compare for greater than (MMX)
  2075.  Description
  2076. Compares the individual signed data elements (bytes, words, or doublewords) in the destination operand (first operand) to the corresponding signed data elements in the source operand (second operand). If a data element in the destination operand is greater than its corresponding data element in the source operand, the data element in the destination operand is set to all ones; otherwise, it is set to all zeros. The destination operand must be an MMX register; the source operand may be either an MMX register or a 64-bit memory location. 
  2077. The PCMPGTB instruction compares the signed bytes in the destination operand to the corresponding signed bytes in the source operand, with the bytes in the destination operand being set according to the results. 
  2078. The PCMPGTW instruction compares the signed words in the destination operand to the corresponding signed words in the source operand, with the words in the destination operand being set according to the results. 
  2079. The PCMPGTD instruction compares the signed doublewords in the destination operand to the corresponding signed doublewords in the source operand, with the doublewords in the destination operand being set according to the results. '
  2080.  Flags affected
  2081. None. C
  2082.  Instruction size and timings
  2083. Not available. 
  2084.  Example
  2085. Not available. 
  2086. contents
  2087. screen
  2088.  PMADDWD - Packed multiply and add (MMX)
  2089.  Description
  2090. Multiplies the individual signed words of the destination operand by the corresponding signed words of the source operand, producing four signed, doubleword results. The two doubleword results from the multiplication of the high-order words are added together and stored in the upper doubleword of the destination operand; the two doubleword results from the multiplication of the low-order words are added together and stored in the lower doubleword of the destination operand. The destination operand must be an MMX register; the source operand may be either an MMX register or a 64-bit memory location. 
  2091. The PMADDWD instruction wraps around to 80000000H only when all four words of both the source and destination operands are 8000H. '
  2092.  Flags affected
  2093. None. C
  2094.  Instruction size and timings
  2095. Not available. 
  2096.  Example
  2097. Not available. 
  2098. contents
  2099. screen
  2100.  PMULHW - Packed multiply high (MMX)
  2101.  Description
  2102. Multiplies the four signed words of the source operand (second operand) by the four signed words of the destination operand (first operand), producing four signed, doubleword, intermediate results. The high-order word of each intermediate result is then written to its corresponding word location in the destination operand. The destination operand must be an MMX register; the source operand may be either an MMX register or a 64-bit memory location. '
  2103.  Flags affected
  2104. None. C
  2105.  Instruction size and timings
  2106. Not available. 
  2107.  Example
  2108. Not available. 
  2109. contents
  2110. screen
  2111.  PMULLW - Packed multiply low (MMX)
  2112.  Description
  2113. Multiplies the four signed or unsigned words of the source operand (second operand) with the four signed or unsigned words of the destination operand (first operand), producing four doubleword, intermediate results. The low-order word of each intermediate result is then written to its corresponding word location in the destination operand. The destination operand must be an MMX register; the source operand may be either an MMX register or a 64- bit memory location. '
  2114.  Flags affected
  2115. None. C
  2116.  Instruction size and timings
  2117. Not available. 
  2118.  Example
  2119. Not available. 
  2120. contents
  2121. screen
  2122.  POP - Pop a value from the stack
  2123.  Description
  2124. Loads the value from the top of the stack to the location specified with the destination operand and then increments the stack pointer. The destination operand can be a general-purpose register, memory location, or segment register. 
  2125. The address-size attribute of the stack segment determines the stack pointer size (16 bits or 32 bits - the source address size), and the operand-size attribute of the current code segment determines the amount the stack pointer is incremented (2 bytes or 4 bytes). For example, if these address- and operand-size attributes are 32, the 32-bit ESP register (stack pointer) is incre-mented by 4 and, if they are 16, the 16-bit SP register is incremented by 2. (The B flag in the stack segment's segment descriptor determines the stack's address-size attribute, and the D flag in the current code segment's segment descriptor, along with prefixes, determines the operand-size attribute and also the address-size attribute of the destination operand.) 
  2126. If the destination operand is one of the segment registers DS, ES, FS, GS, or SS, the value loaded into the register must be a valid segment selector. In protected mode, popping a segment selector into a segment register automatically causes the descriptor information associated with that segment selector to be loaded into the hidden (shadow) part of the segment register and causes the selector and the descriptor information to be validated. z
  2127. A null value (0000-0003) may be popped into the DS, ES, FS, or GS register without causing a general protection fault. However, any subsequent attempt to reference a segment whose corresponding segment register is loaded with a null value causes a general protection exception. In this situation, no memory reference occurs and the saved value of the segment register is null. 
  2128. The POP instruction cannot pop a value into the CS register. To load the CS register from the stack, use the RET instruction. 
  2129. If the ESP register is used as a base register for addressing a destination operand in memory, the POP instruction computes the effective address of the operand after it increments the ESP register. 
  2130. The POP ESP instruction increments the stack pointer (ESP) before data at the old top of stack is written into the destination. o
  2131. A POP SS instruction inhibits all interrupts, including the NMI interrupt, until after execution of the next instruction. This action allows sequential execution of POP SS and MOV ESP, EBP instructions without the danger of having an invalid stack during an interrupt. However, use of the LSS instruction is the preferred method of loading the SS and ESP registers. '
  2132.  Flags affected
  2133. None. C
  2134.  Instruction size and timings
  2135.  operand     bytes   8088    186     286     386     486     Pentium
  2136.  reg          1      12      10       5       4       1       1   UV
  2137.  mem       2+d(0-2)  25+EA   20       5       5       6       3   NP
  2138.  seg          1      12       8       5       7       3       3   NP
  2139.  FS/GS        2       -       -       -       7       3       3   NP
  2140.  Protected Mode
  2141.  operand     bytes                   286     386     486     Pentium
  2142.  CS/DS/ES     1                      20      21       9     3-12  NP
  2143.  SS           1                      20      21       9     8-17  NP
  2144.  FS/GS        2                       -      21       9     3-12  NP
  2145.  Example
  2146.  pop eax        ; Pop dword off stack into EAX
  2147. contents
  2148. screen
  2149.  POPA/POPAD - Pop all general purpose registers (186+/386+)
  2150.  Description
  2151. Pops doublewords (POPAD) or words (POPA) from the stack into the general-purpose registers. The registers are loaded in the following order: EDI, ESI, EBP, EBX, EDX, ECX, and EAX (if the operand-size attribute is 32) and DI, SI, BP, BX, DX, CX, and AX (if the operand-size attribute is 16). (These instructions reverse the operation of the PUSHA/PUSHAD instructions.) The value on the stack for the ESP or SP register is ignored. Instead, the ESP or SP register is incremented after each register is loaded. 
  2152. The POPA (pop all) and POPAD (pop all double) mnemonics reference the same opcode. The POPA instruction is intended for use when the operand-size attribute is 16 and the POPAD instruction for when the operand-size attribute is 32. Some assemblers may force the operand size to 16 when POPA is used and to 32 when POPAD is used (using the operand-size override prefix [66H] if necessary). Others may treat these mnemonics as synonyms (POPA/POPAD) and use the current setting of the operand-size attribute to determine the size of values to be popped from the stack, regardless of the mnemonic used. (The D flag in the current code segment's segment descriptor determines the operand-size attribute.) '
  2153.  Flags affected
  2154. None. C
  2155.  Instruction size and timings
  2156.  variations  bytes           186     286     386     486     Pentium
  2157.  popa         1              51      19      24       9       5   NP
  2158.  popad        1               -       -      24       9       5   NP
  2159.  Example
  2160.  popa           ; Pop all registers
  2161. contents
  2162. screen
  2163.  POPF/POPFD - Pop flags/pop flags double (386+)
  2164.  Description
  2165. Pops a doubleword (POPFD) from the top of the stack (if the current operand-size attribute is 32) and stores the value in the EFLAGS register or pops a word from the top of the stack (if the operand-size attribute is 16) and stores it in the lower 16 bits of the EFLAGS register (that is, the FLAGS register). (These instructions reverse the operation of the PUSHF/PUSHFD instructions.) 
  2166. The POPF (pop flags) and POPFD (pop flags double) mnemonics reference the same opcode. The POPF instruction is intended for use when the operand-size attribute is 16 and the POPFD instruction for when the operand-size attribute is 32. Some assemblers may force the operand size to 16 when POPF is used and to 32 when POPFD is used. Others may treat these mnemonics as synonyms (POPF/POPFD) and use the current setting of the operand-size attribute to determine the size of values to be popped from the stack, regardless of the mnemonic used. 
  2167. The effect of the POPF/POPFD instructions on the EFLAGS register changes slightly, depending on the mode of operation of the processor. When the processor is operating in protected mode at privilege level 0 (or in real-address mode, which is equivalent to privilege level 0), all the non-reserved flags in the EFLAGS register except the VIP, VIF, and VM flags can be modified. The VIP and VIF flags are cleared, and the VM flag is unaffected. 
  2168. When operating in protected mode, with a privilege level greater than 0, but less than or equal to IOPL, all the flags can be modified except the IOPL field and the VIP, VIF, and VM flags. Here, the IOPL flags are unaffected, the VIP and VIF flags are cleared, and the VM flag is unaf-fected. The interrupt flag (IF) is altered only when executing at a level at least as privileged as the IOPL. If a POPF/POPFD instruction is executed with insufficient privilege, an exception does not occur, but the privileged bits do not change. 
  2169. When operating in virtual-8086 mode, the I/O privilege level (IOPL) must be equal to 3 to use POPF/POPFD instructions and the VM, RF, IOPL, VIP, and VIF flags are unaffected. If the IOPL is less than 3, the POPF/POPFD instructions cause a general-protection exception. '
  2170.  Flags affected
  2171. All flags except the reserved bits and the VM bit. C
  2172.  Instruction size and timings
  2173.  variations  bytes   8088    186     286     386     486     Pentium
  2174.  popf         1      12       8       5       5       9       6   NP
  2175.  popfd        1       -       -       -       5       9       6   NP
  2176.  Protected Mode
  2177.              bytes                   286     386     486     Pentium
  2178.  popf         1                       5       5       6       4   NP
  2179.  popfd        1                       -       5       6       4   NP
  2180.  Example
  2181.  popfd          ; Pop EFLAGS off the stack
  2182. contents
  2183. screen
  2184.  POR - Bitwise logical OR (MMX)
  2185.  Description
  2186. Performs a bitwise logical OR operation on the quadword source (second) and destination (first) operands and stores the result in the destination operand location. The source operand can be an MMX register or a quadword memory location; the destination operand must be an MMX register. Each bit of the result is made 0 if the corresponding bits of both operands are 0; otherwise the bit is set to 1. '
  2187.  Flags affected
  2188. None. C
  2189.  Instruction size and timings
  2190. Not available. 
  2191.  Example
  2192. Not available. 
  2193. contents
  2194. screen
  2195.  PSLLW/PSLLD/PSLLQ - Packed shift left logical (MMX)
  2196.  Description
  2197. Shifts the bits in the data elements (words, doublewords, or quadword) in the destination operand (first operand) to the left by the number of bits specified in the unsigned count operand (second operand). The result of the shift operation is written to the destination operand. As the bits in the data elements are shifted left, the empty low-order bits are cleared (set to zero). If the value specified by the count operand is greater than 15 (for words), 31 (for doublewords), or 63 (for a quadword), then the destination operand is set to all zeros. 
  2198. The destination operand must be an MMX register; the count operand can be either an MMX register, a 64-bit memory location, or an 8-bit immediate. 
  2199. The PSLLW instruction shifts each of the four words of the destination operand to the left by the number of bits specified in the count operand; the PSLLD instruction shifts each of the two doublewords of the destination operand; and the PSLLQ instruction shifts the 64-bit quadword in the destination operand. As the individual data elements are shifted left, the empty low-order bit positions are filled with zeros. '
  2200.  Flags affected
  2201. None. C
  2202.  Instruction size and timings
  2203. Not available. 
  2204.  Example
  2205. Not available. 
  2206. contents
  2207. screen
  2208.  PSRAW/PSRAD - Packed shift right arithmetic (MMX)
  2209.  Description
  2210. Shifts the bits in the data elements (words or doublewords) in the destination operand (first operand) to the right by the amount of bits specified in the unsigned count operand (second operand). The result of the shift operation is written to the destination operand. The empty high-order bits of each element are filled with the initial value of the sign bit of the data element. If the value specified by the count operand is greater than 15 (for words) or 31 (for doublewords), each destination data element is filled with the initial value of the sign bit of the element. 
  2211. The destination operand must be an MMX register; the count operand (source operand) can be either an MMX register, a 64-bit memory location, or an 8-bit immediate. ^
  2212. The PSRAW instruction shifts each of the four words in the destination operand to the right by the number of bits specified in the count operand; the PSRAD instruction shifts each of the two doublewords in the destination operand. As the individual data elements are shifted right, the empty high-order bit positions are filled with the sign value. '
  2213.  Flags affected
  2214. None. C
  2215.  Instruction size and timings
  2216. Not available. 
  2217.  Example
  2218. Not available. 
  2219. contents
  2220. screen
  2221.  PSRLW/PSRLD/PSRLQ - Packed shift right logical (MMX)
  2222.  Description
  2223. Shifts the bits in the data elements (words, doublewords, or quadword) in the destination operand (first operand) to the right by the number of bits specified in the unsigned count operand (second operand). The result of the shift operation is written to the destination operand. As the bits in the data elements are shifted right, the empty high-order bits are cleared (set to zero). If the value specified by the count operand is greater than 15 (for words), 31 (for doublewords), or 63 (for a quadword), then the destination operand is set to all zeros. 
  2224. The destination operand must be an MMX register; the count operand can be either an MMX register, a 64-bit memory location, or an 8-bit immediate. 
  2225. The PSRLW instruction shifts each of the four words of the destination operand to the right by the number of bits specified in the count operand; the PSRLD instruction shifts each of the two doublewords of the destination operand; and the PSRLQ instruction shifts the 64-bit quadword in the destination operand. As the individual data elements are shifted right, the empty high-order bit positions are filled with zeros. '
  2226.  Flags affected
  2227. None. C
  2228.  Instruction size and timings
  2229. Not available. 
  2230.  Example
  2231. Not available. 
  2232. contents
  2233. screen
  2234.  PSUBB/PSUBW/PSUBD - Packed subtract (MMX)
  2235.  Description
  2236. Subtracts the individual data elements (bytes, words, or doublewords) of the source operand (second operand) from the individual data elements of the destination operand (first operand). If the result of a subtraction exceeds the range for the specified data type (overflows), the result is wrapped around, meaning that the result is truncated so that only the lower (least significant) bits of the result are returned (that is, the carry is ignored). 
  2237. The destination operand must be an MMX register; the source operand can be either an MMX register or a quadword memory location. O
  2238. The PSUBB instruction subtracts the bytes of the source operand from the bytes of the destination operand and stores the results to the destination operand. When an individual result is too large to be represented in 8 bits, the lower 8 bits of the result are written to the destination operand and therefore the result wraps around. R
  2239. The PSUBW instruction subtracts the words of the source operand from the words of the desti-nation operand and stores the results to the destination operand. When an individual result is too large to be represented in 16 bits, the lower 16 bits of the result are written to the destination operand and therefore the result wraps around. ]
  2240. The PSUBD instruction subtracts the doublewords of the source operand from the doublewords of the destination operand and stores the results to the destination operand. When an individual result is too large to be represented in 32 bits, the lower 32 bits of the result are written to the destination operand and therefore the result wraps around. 
  2241. Note that like the integer SUB instruction, the PSUBB, PSUBW, and PSUBD instructions can operate on either unsigned or signed (two's complement notation) packed integers. Unlike the integer instructions, none of the MMX instructions affect the EFLAGS register. With MMX instructions, there are no carry or overflow flags to indicate when overflow has occurred, so the software must control the range of values or else use the "with saturation" MMX instructions. '
  2242.  Flags affected
  2243. None. C
  2244.  Instruction size and timings
  2245. Not available. 
  2246.  Example
  2247. Not available. 
  2248. contents
  2249. screen
  2250.  PSUBSB/PSUBSW - Packed subtract with saturation (MMX)
  2251.  Description
  2252. Subtracts the individual signed data elements (bytes or words) of the source operand (second operand) from the individual signed data elements of the destination operand (first operand). (See Figure 3-23.) If the result of a subtraction exceeds the range for the specified data type, the result is saturated. The destination operand must be an MMX register; the source operand can be either an MMX register or a quadword memory location. w
  2253. The PSUBSB instruction subtracts the signed bytes of the source operand from the signed bytes of the destination operand and stores the results to the destination operand. When an individual result is beyond the range of a signed byte (that is, greater than 7FH or less than 80H), the saturated byte value of 7FH or 80H, respectively, is written to the destination operand. 
  2254. The PSUBSW instruction subtracts the signed words of the source operand from the signed words of the destination operand and stores the results to the destination operand. When an individual result is beyond the range of a signed word (that is, greater than 7FFFH or less than 8000H), the saturated word value of 7FFFH or 8000H, respectively, is written to the destination operand. '
  2255.  Flags affected
  2256. None. C
  2257.  Instruction size and timings
  2258. Not available. 
  2259.  Example
  2260. Not available. 
  2261. contents
  2262. screen
  2263.  PSUBUSB/PSUBUSW - Packed subtract with unsigned saturation (MMX)
  2264.  Description
  2265. Subtracts the individual unsigned data elements (bytes or words) of the source operand (second operand) from the individual unsigned data elements of the destination operand (first operand). If the result of an individual subtraction exceeds the range for the specified unsigned data type, the result is saturated. The destination operand musts be an MMX register; the source operand can be either an MMX register or a quadword memory location. C
  2266. The PSUBUSB instruction subtracts the unsigned bytes of the source operand from the unsigned bytes of the destination operand and stores the results to the destination operand. When an indi-vidual result is less than zero (a negative value), the saturated unsigned byte value of 00H is written to the destination operand. D
  2267. The PSUBUSW instruction subtracts the unsigned words of the source operand from the unsigned words of the destination operand and stores the results to the destination operand. When an individual result is less than zero (a negative value), the saturated unsigned word value of 0000H is written to the destination operand. '
  2268.  Flags affected
  2269. None. C
  2270.  Instruction size and timings
  2271. Not available. 
  2272.  Example
  2273. Not available. 
  2274. contents
  2275. screen
  2276.  PUNPCKHBW/PUNPCKHWD/PUNPCKHDQ - Unpack high packed data (MMX)
  2277.  Description
  2278. Unpacks and interleaves the high-order data elements (bytes, words, or doublewords) of the destination operand (first operand) and source operand (second operand) into the destination operand. The low-order data elements are ignored. The destination operand must be an MMX register; the source operand may be either an MMX register or a 64-bit memory location. When the source data comes from a memory operand, the full 64-bit operand is accessed from memory, but the instruction uses only the high-order 32 bits. 
  2279. The PUNPCKHBW instruction interleaves the four high-order bytes of the source operand and the four high-order bytes of the destination operand and writes them to the destination operand. 
  2280. The PUNPCKHWD instruction interleaves the two high-order words of the source operand and the two high-order words of the destination operand and writes them to the destination operand. 
  2281. The PUNPCKHDQ instruction interleaves the high-order doubleword of the source operand and the high-order doubleword of the destination operand and writes them to the destination operand. 
  2282. If the source operand is all zeros, the result (stored in the destination operand) contains zero extensions of the high-order data elements from the original value in the destination operand. With the PUNPCKHBW instruction the high-order bytes are zero extended (that is, unpacked into unsigned words), and with the PUNPCKHWD instruction, the high-order words are zero extended (unpacked into unsigned doublewords). '
  2283.  Flags affected
  2284. None. C
  2285.  Instruction size and timings
  2286. Not available. 
  2287.  Example
  2288. Not available. 
  2289. contents
  2290. screen
  2291.  PUNPCKLBW/PUNPCKLWD/PUNPCKLDQ - Unpack low packed data (MMX)
  2292.  Description
  2293. Unpacks and interleaves the low-order data elements (bytes, words, or doublewords) of the destination and source operands into the destination operand (see Figure 3-26). The destination operand must be an MMX register; the source operand may be either an MMX register or a memory location. When source data comes from an MMX register, the upper 32 bits of the register are ignored. When the source data comes from a memory, only 32-bits are accessed from memory. 
  2294. The PUNPCKLBW instruction interleaves the four low-order bytes of the source operand and the four low-order bytes of the destination operand and writes them to the destination operand. 
  2295. The PUNPCKLWD instruction interleaves the two low-order words of the source operand and the two low-order words of the destination operand and writes them to the destination operand. 
  2296. The PUNPCKLDQ instruction interleaves the low-order doubleword of the source operand and the low-order doubleword of the destination operand and writes them to the destination operand. 
  2297. If the source operand is all zeros, the result (stored in the destination operand) contains zero extensions of the high-order data elements from the original value in the destination operand. With the PUNPCKLBW instruction the low-order bytes are zero extended (that is, unpacked into unsigned words), and with the PUNPCKLWD instruction, the low-order words are zero extended (unpacked into unsigned doublewords). '
  2298.  Flags affected
  2299. None. C
  2300.  Instruction size and timings
  2301. Not available. 
  2302.  Example
  2303. Not available. 
  2304. contents
  2305. screen
  2306.  PUSH - Push word/dword onto the stack
  2307.  Description
  2308. Decrements the stack pointer and then stores the source operand on the top of the stack. The address-size attribute of the stack segment determines the stack pointer size (16 bits or 32 bits), and the operand-size attribute of the current code segment determines the amount the stack pointer is decremented (2 bytes or 4 bytes). For example, if these address- and operand-size attributes are 32, the 32-bit ESP register (stack pointer) is decremented by 4 and, if they are 16, the 16-bit SP register is decremented by 2.(The B flag in the stack segment's segment descriptor determines the stack's address-size attribute, and the D flag in the current code segment's segment descriptor, along with prefixes, determines the operand-size attribute and also the address-size attribute of the source operand.) 
  2309. Pushing a 16-bit operand when the stack address-size attribute is 32 can result in a misaligned the stack pointer (that is, the stack pointer is not aligned on a doubleword boundary). U
  2310. The PUSH ESP instruction pushes the value of the ESP register as it existed before the instruction was executed. Thus, if a PUSH instruction uses a memory operand in which the ESP register is used as a base register for computing the operand address, the effective address of the operand is computed before the ESP register is decremented. 
  2311. In the real-address mode, if the ESP or SP register is 1 when the PUSH instruction is executed, the processor shuts down due to a lack of stack space. No exception is generated to indicate this condition. b
  2312. For processors from the 286 on, the PUSH ESP instruction pushes the value of the ESP register as it existed before the instruction was executed. (This is also true in the real-address and virtual-8086 modes.) For the 8086 processor, the PUSH SP instruction pushes the new value of the SP register (that is the value after it has been decremented by 2). '
  2313.  Flags affected
  2314. None. C
  2315.  Instruction size and timings
  2316.  operand    bytes   8088    186     286     386     486     Pentium
  2317.  reg         1      15      10       3       2       1       1   UV
  2318.  mem      2+d(0-2)  24+EA   16       5       5       4       2   NP
  2319.  seg         1      14       9       3       2       3       1   NP
  2320.  imm     1+i(1,2)    -       -       3       2       1       1   NP
  2321.  FS/GS       2       -       -       -       2       3       1   NP
  2322.  Example
  2323.  push eax       ; Push EAX onto the stack
  2324. contents
  2325. screen
  2326.  PUSHA/PUSHAD - Push all general purpose registers (186+/386+)
  2327.  Description
  2328. Pushes the contents of the general-purpose registers onto the stack. The registers are stored on the stack in the following order: EAX, ECX, EDX, EBX, EBP, ESP (original value), EBP, ESI, and EDI (if the current operand-size attribute is 32) and AX, CX, DX, BX, SP (original value), BP, SI, and DI (if the operand-size attribute is 16). (These instructions perform the reverse operation of the POPA/POPAD instructions.) The value pushed for the ESP or SP register is its value before prior to pushing the first register. %
  2329. The PUSHA (push all) and PUSHAD (push all double) mnemonics reference the same opcode. The PUSHA instruction is intended for use when the operand-size attribute is 16 and the PUSHAD instruction for when the operand-size attribute is 32. Some assemblers may force the operand size to 16 when PUSHA is used and to 32 when PUSHAD is used. Others may treat these mnemonics as synonyms (PUSHA/PUSHAD) and use the current setting of the operand-size attribute to determine the size of values to be pushed from the stack, regardless of the mnemonic used. 
  2330. In the real-address mode, if the ESP or SP register is 1, 3, or 5 when the PUSHA/PUSHAD instruction is executed, the processor shuts down due to a lack of stack space. No exception is generated to indicate this condition. '
  2331.  Flags affected
  2332. None. C
  2333.  Instruction size and timings
  2334.  variations  bytes           186     286     386     486     Pentium
  2335.  pusha        1              36      17      18      11       5   NP
  2336.  pushad       1               -       -      18      11       5   NP
  2337.  Example
  2338.  pusha          ; Push all general-purpose registers onto the stack
  2339. contents
  2340. screen
  2341.  PUSHF/PUSHFD - Push flags register onto the stack
  2342.  Description
  2343. Decrements the stack pointer by 4 (if the current operand-size attribute is 32) and pushes the entire contents of the EFLAGS register onto the stack, or decrements the stack pointer by 2 (if the operand-size attribute is 16) and pushes the lower 16 bits of the EFLAGS register (that is, the FLAGS register) onto the stack. (These instructions reverse the operation of the POPF/POPFD instructions.) When copying the entire EFLAGS register to the stack, the VM and RF flags (bits 16 and 17) are not copied; instead, the values for these flags are cleared in the EFLAGS image stored on the stack. )
  2344. The PUSHF (push flags) and PUSHFD (push flags double) mnemonics reference the same opcode. The PUSHF instruction is intended for use when the operand-size attribute is 16 and the PUSHFD instruction for when the operand-size attribute is 32. Some assemblers may force the operand size to 16 when PUSHF is used and to 32 when PUSHFD is used. Others may treat these mnemonics as synonyms (PUSHF/PUSHFD) and use the current setting of the operand-size attribute to determine the size of values to be pushed from the stack, regardless of the mnemonic used. 
  2345. When in virtual-8086 mode and the I/O privilege level (IOPL) is less than 3, the PUSHF/PUSHFD instruction causes a general protection exception. 
  2346. In the real-address mode, if the ESP or SP register is 1, 3, or 5 when the PUSHA/PUSHAD instruction is executed, the processor shuts down due to a lack of stack space. No exception is generated to indicate this condition. '
  2347.  Flags affected
  2348. None. C
  2349.  Instruction size and timings
  2350.  variations  bytes   8088    186     286     386     486     Pentium
  2351.  pushf        1      14       9       3       4       4       9   NP
  2352.  pushfd       1       -       -       -       4       4       9   NP
  2353.  Protected Mode
  2354.              bytes                   286     386     486     Pentium
  2355.  pushf        1                       3       4       3       3   NP
  2356.  pushfd       1                       -       4       3       3   NP
  2357.  Example
  2358.  pushf          ; Push EFLAGS onto the stack
  2359. contents
  2360. screen
  2361.  PXOR - Logical exclusive OR (MMX)
  2362.  Description
  2363. Performs a bitwise logical exclusive-OR (XOR) operation on the quadword source (second) and destination (first) operands and stores the result in the destination operand location. The source operand can be an MMX register or a quadword memory location; the destination operand must be an MMX register. Each bit of the result is 1 if the corresponding bits of the two operands are different; each bit is 0 if the corresponding bits of the operands are the same. '
  2364.  Flags affected
  2365. None. C
  2366.  Instruction size and timings
  2367. Not available. 
  2368.  Example
  2369. Not available. 
  2370. contents
  2371. screen
  2372.  RCL/RCR/ROL/ROR - Rotate
  2373.  Description
  2374. Shifts (rotates) the bits of the first operand (destination operand) the number of bit positions specified in the second operand (count operand) and stores the result in the destination operand. The destination operand can be a register or a memory location; the count operand is an unsigned integer that can be an immediate or a value in the CL register. The processor restricts the count to a number between 0 and 31 by masking all the bits in the count operand except the 5 least-significant bits. 
  2375. The rotate left (ROL) and rotate through carry left (RCL) instructions shift all the bits toward more-significant bit positions, except for the most-significant bit, which is rotated to the least-significant bit location. 
  2376.  ROL operation
  2377.         
  2378.      
  2379.         
  2380.         
  2381.              
  2382.  RCL operation
  2383.            
  2384.      
  2385.         
  2386.         
  2387.      
  2388.         
  2389. The rotate right (ROR) and rotate through carry right (RCR) instructions shift all the bits toward less significant bit positions, except for the least-significant bit, which is rotated to the most-significant bit location. 
  2390.  ROR operation
  2391.            
  2392.      
  2393.         
  2394.         
  2395.         
  2396.  RCR operation
  2397.            
  2398.      
  2399.         
  2400.         
  2401.      
  2402.         
  2403. The RCL and RCR instructions include the CF flag in the rotation. The RCL instruction shifts the CF flag into the least-significant bit and shifts the most-significant bit into the CF flag. The RCR instruction shifts the CF flag into the most-significant bit and shifts the least-significant bit into the CF flag. For the ROL and ROR instructions, the original value of the CF flag is not a part of the result, but the CF flag receives a copy of the bit that was shifted from one end to the other. 
  2404. The OF flag is defined only for the 1-bit rotates; it is undefined in all other cases (except that a zero-bit rotate does nothing, that is affects no flags). For left rotates, the OF flag is set to the exclusive OR of the CF bit (after the rotate) and the most-significant bit of the result. For right rotates, the OF flag is set to the exclusive OR of the two most-significant bits of the result. >
  2405. The 8086 does not mask the rotation count. However, all other processors (starting with the 286 processor) do mask the rotation count to 5 bits, resulting in a maximum count of 31. This masking is done in all operating modes (including the virtual-8086 mode) to reduce the maximum execution time of the instructions. '
  2406.  Flags affected
  2407. The CF flag contains the value of the bit shifted into it. The OF flag is affected only for single-bit rotates (see above); it is undefined for multi-bit rotates. The SF, ZF, AF, and PF flags are not affected. C
  2408.  Instruction size and timings
  2409.  RCL and RCR
  2410.  operands    bytes   8088    186     286     386     486     Pentium
  2411.  reg, 1       2       2       2       2       9       3       1   PU
  2412.  mem, 1    2+d(0,2)  23+EA   15       7      10       4       3   PU
  2413.  reg, cl      2       8+4n    5+n    5+n      9      8-30    7-24 NP
  2414.  mem, cl   2+d(0,2) 28+EA+4n 17+n    8+n     10      9-31    9-26 NP
  2415.  reg, imm     3       -       5+n    5+n      9      8-30    8-25 NP
  2416.  mem, imm  3+d(0,2)   -      17+n    8+n     10      9-31   10-27 NP
  2417.  ROL and ROR
  2418.  operands    bytes   8088    186     286     386     486     Pentium
  2419.  reg, 1       2       2       2       2       3       3       1   PU
  2420.  mem, 1    2+d(0,2)  23+EA   15       7       7       4       3   PU
  2421.  reg, cl      2       8+4n    5+n    5+n      3       3       4   NP
  2422.  mem, cl   2+d(0,2) 28+EA+4n 17+n    8+n      7       4       4   NP
  2423.  reg, imm     3       -       5+n    5+n      3       2       1   PU
  2424.  mem, imm  3+d(0,2)   -      17+n    8+n      7       4       3   PU*
  2425.  * = not pairable if there is a displacement and immediate
  2426.  Example
  2427.  ror eax, 16    ; Rotate EAX by 16 bits
  2428. contents
  2429. screen
  2430.  RDMSR - Read from Model Specific Register (Pentium+)
  2431.  Description
  2432. Loads the contents of a 64-bit model specific register (MSR) specified in the ECX register into registers EDX:EAX. The EDX register is loaded with the high-order 32 bits of the MSR and the EAX register is loaded with the low-order 32 bits. If less than 64 bits are implemented in the MSR being read, the values returned to EDX:EAX in unimplemented bit locations are undefined. 
  2433. This instruction must be executed at privilege level 0 or in real-address mode; otherwise, a general protection exception will be generated. Specifying a reserved or unimplemented MSR address in ECX will also cause a general protection exception. q
  2434. The MSRs control functions for testability, execution tracing, performance-monitoring and machine check errors. x
  2435. The CPUID instruction should be used to determine whether MSRs are supported (EDX[5]=1) before using this instruction. 
  2436. The MSRs and the ability to read them with the RDMSR instruction were introduced into the Intel Architecture with the Pentium processor. Execution of this instruction by an Intel Architecture processor earlier than the Pentium processor results in an invalid opcode exception. '
  2437.  Flags affected
  2438. None. C
  2439.  Instruction size and timings
  2440.  bytes                                           Pentium
  2441.   2                                              20-24 NP
  2442.  Example
  2443.  rdmsr          ; Read MSR addressed by ECX
  2444. contents
  2445. screen
  2446.  RDPMC - Read Performance-Monitoring Countersion (MMX/Pentium Pro+)
  2447.  Description
  2448. Loads the contents of the 40-bit performance-monitoring counter specified in the ECX register into registers EDX:EAX. The EDX register is loaded with the high-order 8 bits of the counter and the EAX register is loaded with the low-order 32 bits. The Pentium Pro processor has two performance-monitoring counters (0 and 1), which are specified by placing 0000H or 0001H, respectively, in the ECX register. N
  2449. The RDPMC instruction allows application code running at a privilege level of 1, 2, or 3 to read the performance-monitoring counters if the PCE flag in the CR4 register is set. This instruction is provided to allow performance monitoring by application code without incurring the overhead of a call to an operating-system procedure. 
  2450. The performance-monitoring counters are event counters that can be programmed to count events such as the number of instructions decoded, number of interrupts received, or number of cache loads. 
  2451. The RDPMC instruction does not serialize instruction execution. That is, it does not imply that all the events caused by the preceding instructions have been completed or that events caused by subsequent instructions have not begun. If an exact event count is desired, software must use a serializing instruction (such as the CPUID instruction) before and/or after the execution of the RDPMC instruction. .
  2452. The RDPMC instruction can execute in 16-bit addressing mode or virtual-8086 mode; however, the full contents of the ECX register are used to determine the counter to access and a full 40-bit result is returned (the low-order 32 bits in the EAX register and the high-order 9 bits in the EDX register). 
  2453. The RDPMC instruction was introduced into the Intel Architecture in the Pentium Pro processor and the Pentium processor with MMX technology. The other Pentium processors have performance-monitoring counters, but they must be read with the RDMSR instruction. '
  2454.  Flags affected
  2455. None. C
  2456.  Instruction size and timings
  2457. Not available. 
  2458.  Example
  2459.  rdpmc     ; Read performance-monitoring counter addressed by ECX
  2460. contents
  2461. screen
  2462.  RDTSC - Read Time-Stamp Counter (Pentium+)
  2463.  Description
  2464. Loads the current value of the processor's time-stamp counter into the EDX:EAX registers. The time-stamp counter is contained in a 64-bit MSR. The high-order 32 bits of the MSR are loaded into the EDX register, and the low-order 32 bits are loaded into the EAX register. The processor increments the time-stamp counter MSR every clock cycle and resets it to 0 whenever the processor is reset. s
  2465. The time stamp disable (TSD) flag in register CR4 restricts the use of the RDTSC instruction. When the TSD flag is clear, the RDTSC instruction can be executed at any privilege level; when the flag is set, the instruction can only be executed at privilege level 0. The time-stamp counter can also be read with the RDMSR instruction, when executing at privilege level 0. 
  2466. The RDTSC instruction is not a serializing instruction. Thus, it does not necessarily wait until all previous instructions have been executed before reading the counter. Similarly, subsequent instructions may begin execution before the read operation is performed. '
  2467.  Flags affected
  2468. None. C
  2469.  Instruction size and timings
  2470. Not available. 
  2471.  Example
  2472.  rdtsc          ; EDX:EAX = Time-Stamp Counter value
  2473. contents
  2474. screen
  2475.  REP/REPE/REPZ/REPNE/REPNZ - Repeat string operation prefix
  2476.  Description
  2477. Repeats a string instruction the number of times specified in the count register ((E)CX) or until the indicated condition of the ZF flag is no longer met. The REP (repeat), REPE (repeat while equal), REPNE (repeat while not equal), REPZ (repeat while zero), and REPNZ (repeat while not zero) mnemonics are prefixes that can be added to one of the string instructions. The REP prefix can be added to the INS, OUTS, MOVS, LODS, and STOS instructions, and the REPE, REPNE, REPZ, and REPNZ prefixes can be added to the CMPS and SCAS instructions. (The REPZ and REPNZ prefixes are synonymous forms of the REPE and REPNE prefixes, respectively.) The behavior of the REP prefix is undefined when used with non-string instructions. 
  2478. The REP prefixes apply only to one string instruction at a time. To repeat a block of instructions, use the LOOP instruction or another looping construct. 
  2479. All of these repeat prefixes cause the associated instruction to be repeated until the count in register (E)CX is decremented to 0 (see the following table). (If the current address-size attribute is 32, register ECX is used as a counter, and if the address-size attribute is 16, the CX register is used.) The REPE, REPNE, REPZ, and REPNZ prefixes also check the state of the ZF flag after each iteration and terminate the repeat loop if the ZF flag is not in the specified state. When both termination conditions are tested, the cause of a repeat termination can be determined either by testing the (E)CX register with a JECXZ instruction or by testing the ZF flag with a JZ, JNZ, and JNE instruction. 
  2480.  Repeat Conditions
  2481.  Repeat Prefix      Termination Condition 1      Termination Condition 2
  2482.  REP                ECX=0                        None
  2483.  REPE/REPZ          ECX=0                        ZF=0
  2484.  REPNE/REPNZ        ECX=0                        ZF=1
  2485. When the REPE/REPZ and REPNE/REPNZ prefixes are used, the ZF flag does not require initialization because both the CMPS and SCAS instructions affect the ZF flag according to the results of the comparisons they make. T
  2486. A repeating string operation can be suspended by an exception or interrupt. When this happens, the state of the registers is preserved to allow the string operation to be resumed upon a return from the exception or interrupt handler. The source and destination registers point to the next string elements to be operated on, the EIP register points to the string instruction, and the ECX register has the value it held following the last successful iteration of the instruction. This mechanism allows long string operations to proceed without affecting the interrupt response time of the system. M
  2487. When a fault occurs during the execution of a CMPS or SCAS instruction that is prefixed with REPE or REPNE, the EFLAGS value is restored to the state prior to the execution of the instruction. Since the SCAS and CMPS instructions do not use EFLAGS as an input, the processor can resume the instruction after the page fault handler. 
  2488. Use the REP INS and REP OUTS instructions with caution. Not all I/O ports can handle the rate at which these instructions execute. R
  2489. A REP STOS instruction is the fastest way to initialize a large block of memory. '
  2490.  Flags affected
  2491. None; however, the CMPS and SCAS instructions do set the status flags in the EFLAGS register. C
  2492.  Instruction size and timings
  2493. See MOVS and STOS. 
  2494.  REPE/REPZ/REPNE/REPNZ
  2495. See CMPS and SCAS. 
  2496.  Example
  2497.  rep movsb      ; Repeatedly move bytes
  2498. contents
  2499. screen
  2500.  RET/RETN/RETF - Return from procedure
  2501.  Description
  2502. Transfers program control to a return address located on the top of the stack. The address is usually placed on the stack by a CALL instruction, and the return is made to the instruction that follows the CALL instruction. 0
  2503. The optional source operand specifies the number of stack bytes to be released after the return address is popped; the default is none. This operand can be used to release parameters from the stack that were passed to the called procedure and are no longer needed. It must be used when the CALL instruction used to switch to a new procedure uses a call gate with a non-zero word count to access the new procedure. Here, the source operand for the RET instruction must specify the same number of bytes as is specified in the word count field of the call gate. N
  2504. The RET instruction can be used to execute three different types of returns:     
  2505.  Near return (RETN) - a return to a calling procedure within the current
  2506.                         code segment (the segment currently pointed to by the
  2507.                         CS register), sometimes referred to as an
  2508.                         intrasegment return.
  2509.  Far return (RETF)  - a return to a calling procedure located in a different
  2510.                         segment than the current code segment, sometimes
  2511.                         referred to as an intersegment return.
  2512.  Inter-privilege-level far return - a far return to a different privilege
  2513.                                       level than that of the currently
  2514.                                       executing program or procedure.
  2515. The inter-privilege-level return type can only be executed in protected mode. 
  2516. When executing a near return, the processor pops the return instruction pointer (offset) from the top of the stack into the EIP register and begins program execution at the new instruction pointer. The CS register is unchanged. 4
  2517. When executing a far return, the processor pops the return instruction pointer from the top of the stack into the EIP register, then pops the segment selector from the top of the stack into the CS register. The processor then begins program execution in the new code segment at the new instruction pointer. W
  2518. The mechanics of an inter-privilege-level far return are similar to an intersegment return, except that the processor examines the privilege levels and access rights of the code and stack segments being returned to determine if the control transfer is allowed to be made. The DS, ES, FS, and GS segment registers are cleared by the RET instruction during an inter-privilege-level return if they refer to segments that are not allowed to be accessed at the new privilege level. Since a stack switch also occurs on an inter-privilege level return, the ESP and SS registers are loaded from the stack. V
  2519. If parameters are passed to the called procedure during an inter-privilege level call, the optional source operand must be used with the RET instruction to release the parameters on the return. Here, the parameters are released both from the called procedure's stack and the calling procedure's stack (that is, the stack being returned to). '
  2520.  Flags affected
  2521. None. C
  2522.  Instruction size and timings
  2523.  variations/
  2524.  operands     bytes   8088    186     286     386     486     Pentium
  2525.  retn         1       20      16      11+m    10+m     5       2   NP
  2526.  retn imm16   1+d(2)  24      18      11+m    10+m     5       3   NP
  2527.  retf         1       34      22      15+m    18+m    13       4   NP
  2528.  retf imm16   1+d(2)  33      25      15+m    18+m    14       4   NP
  2529.  Example
  2530.  ret            ; Return to calling code
  2531. contents
  2532. screen
  2533.  RSM - Resume from System Management Mode (Pentium+)
  2534.  Description
  2535. Returns program control from system management mode (SMM) to the application program or operating-system procedure that was interrupted when the processor received an SSM interrupt. The processor's state is restored from the dump created upon entering SMM. If the processor detects invalid state information during state restoration, it enters the shutdown state. The following invalid information can cause a shutdown: 
  2536.  Any reserved bit of CR4 is set to 1.
  2537.  Any illegal combination of bits in CR0, such as (PG=1 and PE=0) or
  2538.    (NW=1 and CD=0).
  2539.  (Intel Pentium 
  2540.  and 486 processors only.) The value stored in the state
  2541.    dump base field is not a 32-KByte aligned address.
  2542. The contents of the model-specific registers are not affected by a return from SMM. '
  2543.  Flags affected
  2544. All. C
  2545.  Instruction size and timings
  2546.  bytes                                           Pentium
  2547.   2                                              83   NP
  2548.  Example
  2549.  rsm            ; Resume from System Management Mode
  2550. contents
  2551. screen
  2552.  SAHF - Store AH into flags
  2553.  Description
  2554. Loads the SF, ZF, AF, PF, and CF flags of the EFLAGS register with values from the corresponding bits in the AH register (bits 7, 6, 4, 2, and 0, respectively). Bits 1, 3, and 5 of register AH are ignored; the corresponding reserved bits (1, 3, and 5) in the EFLAGS register remain unchanged. '
  2555.  Flags affected
  2556. The SF, ZF, AF, PF, and CF flags are loaded with values from the AH register. Bits 1, 3, and 5 of the EFLAGS register are unaffected, with the values remaining 1, 0, and 0, respectively. C
  2557.  Instruction size and timings
  2558.  bytes   8088    186     286     386     486     Pentium
  2559.   1       4       3       2       3       2       2   NP
  2560.  Example
  2561.  sahf      ; Store AH in EFLAGS
  2562. contents
  2563. screen
  2564.  SAL/SAR/SHL/SHR - Shift bits
  2565.  Description
  2566. Shifts the bits in the first operand (destination operand) to the left or right by the number of bits specified in the second operand (count operand). Bits shifted beyond the destination operand boundary are first shifted into the CF flag, then discarded. At the end of the shift operation, the CF flag contains the last bit shifted out of the destination operand. 
  2567. The destination operand can be a register or a memory location. The count operand can be an immediate value or register CL. The count is masked to 5 bits, which limits the count range to 0 to 31. A special opcode encoding is provided for a count of 1. \
  2568. The shift arithmetic left (SAL) and shift logical left (SHL) instructions perform the same operation; they shift the bits in the destination operand to the left (toward more significant bit locations). For each shift count, the most significant bit of the destination operand is shifted into the CF flag, and the least significant bit is cleared. 
  2569.  SAL/SHL operation
  2570.         
  2571.      
  2572.      
  2573.         
  2574.         
  2575.      
  2576.      
  2577. The shift arithmetic right (SAR) and shift logical right (SHR) instructions shift the bits of the destination operand to the right (toward less significant bit locations). For each shift count, the least significant bit of the destination operand is shifted into the CF flag, and the most significant bit is either set or cleared depending on the instruction type. The SHR instruction clears the most significant bit. 
  2578.  SAR operation
  2579.            
  2580.      
  2581.         
  2582.         
  2583.      
  2584.         
  2585.  SHR operation
  2586.         
  2587.      
  2588.      
  2589.         
  2590.         
  2591.      
  2592.      
  2593. The SAR and SHR instructions can be used to perform signed or unsigned division, respectively, of the destination operand by powers of 2. For example, using the SAR instruction to shift a signed integer 1 bit to the right divides the value by 2. x
  2594. Using the SAR instruction to perform a division operation does not produce the same result as the IDIV instruction. The quotient from the IDIV instruction is rounded toward zero, whereas the "quotient" of the SAR instruction is rounded toward negative infinity. This difference is apparent only for negative numbers. For example, when the IDIV instruction is used to divide -9 by 4, the result is -2 with a remainder of -1. If the SAR instruction is used to shift -9 right by two bits, the result is -3 and the "remainder" is +3; however, the SAR instruction stores only the most significant bit of the remainder (in the CF flag). 
  2595. The OF flag is affected only on 1-bit shifts. For left shifts, the OF flag is cleared to 0 if the most-significant bit of the result is the same as the CF flag (that is, the top two bits of the original operand were the same); otherwise, it is set to 1. For the SAR instruction, the OF flag is cleared for all 1-bit shifts. For the SHR instruction, the OF flag is set to the most-significant bit of the original operand. K
  2596. The 8086 does not mask the shift count. However, all other Intel Architecture processors (starting with the 286 processor) do mask the shift count to 5 bits, resulting in a maximum count of 31. This masking is done in all operating modes (including the virtual-8086 mode) to reduce the maximum execution time of the instructions. '
  2597.  Flags affected
  2598. The CF flag contains the value of the last bit shifted out of the destination operand; it is undefined for SHL and SHR instructions where the count is greater than or equal to the size (in bits) of the destination operand. The OF flag is affected only for 1-bit shifts (see above); otherwise, it is undefined. The SF, ZF, and PF flags are set according to the result. If the count is 0, the flags are not affected. For a non-zero count, the AF flag is undefined. C
  2599.  Instruction size and timings
  2600.  operands     bytes   8088    186     286     386     486     Pentium
  2601.  reg, 1        2       2       2       2       3       3       1   PU
  2602.  mem, 1     2+d(0,2)  23+EA   15       7       7       4       3   PU
  2603.  reg, cl       2       8+4n    5+n    5+n      3       3       4   NP
  2604.  mem, cl    2+d(0,2) 28+EA+4n 17+n    8+n      7       4       4   NP
  2605.  reg, imm      3       -       5+n    5+n      3       2       1   PU
  2606.  mem, imm   3+d(0,2)   -      17+n    8+n      7       4       3   PU*
  2607.  * = not pairable if there is a displacement and immediate
  2608.  Example
  2609.  shl eax, 1     ; EAX = EAX * 2
  2610. contents
  2611. screen
  2612.  SBB - Integer subtraction with borrow
  2613.  Description
  2614. Adds the source operand (second operand) and the carry (CF) flag, and subtracts the result from the destination operand (first operand). The result of the subtraction is stored in the destination operand. The destination operand can be a register or a memory location; the source operand can be an immediate, a register, or a memory location. (However, two memory operands cannot be used in one instruction.) The state of the CF flag represents a borrow from a previous subtraction. u
  2615. When an immediate value is used as an operand, it is sign-extended to the length of the destination operand format. &
  2616. The SBB instruction does not distinguish between signed or unsigned operands. Instead, the processor evaluates the result for both data types and sets the OF and CF flags to indicate a borrow in the signed or unsigned result, respectively. The SF flag indicates the sign of the signed result. 
  2617. The SBB instruction is usually executed as part of a multibyte or multiword subtraction in which a SUB instruction is followed by a SBB instruction. '
  2618.  Flags affected
  2619. The OF, SF, ZF, AF, PF, and CF flags are set according to the result. C
  2620.  Instruction size and timings
  2621.  operands    bytes   8088    186     286     386     486     Pentium
  2622.  reg, reg     2       3       3       2       2       1       1   PU
  2623.  mem, reg  2+d(0,2)  24+EA   10       7       7       3       3   PU
  2624.  reg, mem  2+d(0,2)  13+EA   10       7       6       2       2   PU
  2625.  reg, imm  2+i(1,2)   4       4       3       2       1       1   PU
  2626.  mem, imm  2+d(0,2)  23+EA   16       7       7       3       3   PU*
  2627.             +i(1,2)
  2628.  acc, imm  1+i(1,2)   4       4       3       2       1       1   PU
  2629.  * = not pairable if there is a displacement and immediate
  2630.  Example
  2631.  sbb eax, ebx   ; EAX = EAX - (EBX + CF)
  2632. contents
  2633. screen
  2634.  SCAS - Scan string
  2635.  Description
  2636. Compares the byte, word, or double word specified with the memory operand with the value in the AL, AX, or EAX register, and sets the status flags in the EFLAGS register according to the results. The memory operand address is read from either the ES:EDI or the ES:DI registers (depending on the address-size attribute of the instruction, 32 or 16, respectively). The ES segment cannot be overridden with a segment override prefix. 
  2637. At the assembly-code level, two forms of this instruction are allowed: the "explicit-operands" form and the "no-operands" form. The explicit-operand form (specified with the SCAS mnemonic) is not supported by NASM. 
  2638. The no-operands form provides "short forms" of the byte, word, and doubleword versions of the SCAS instructions. Here also ES:(E)DI is assumed to be the memory operand and the AL, AX, or EAX register is assumed to be the register operand. The size of the two operands is selected with the mnemonic: SCASB (byte comparison), SCASW (word comparison), or SCASD (doubleword comparison). 
  2639. After the comparison, the (E)DI register is incremented or decremented automatically according to the setting of the DF flag in the EFLAGS register. (If the DF flag is 0, the (E)DI register is incremented; if the DF flag is 1, the (E)DI register is decremented.) The (E)DI register is incremented or decremented by 1 for byte operations, by 2 for word operations, or by 4 for double-word operations. :
  2640. The SCAS, SCASB, SCASW, and SCASD instructions can be preceded by the REP prefix for block comparisons of ECX bytes, words, or doublewords. More often, however, these instructions will be used in a LOOP construct that takes some action based on the setting of the status flags before the next comparison is made. '
  2641.  Flags affected
  2642. The OF, SF, ZF, AF, PF, and CF flags are set according to the temporary result of the comparison. C
  2643.  Instruction size and timings
  2644.  variations  bytes   8088    186     286     386     486     Pentium
  2645.  scasb        1      19      15       7       7       6       4   NP
  2646.  scasw        1      19      15       7       7       6       4   NP
  2647.  scasd        1       -       -       -       7       6       4   NP
  2648.  repX scasb   2      9+15n   5+15n   5+8n    5+8n    7+5n*   8+4n NP
  2649.  repX scasw   2      9+19n   5+15n   5+8n    5+8n    7+5n*   8+4n NP
  2650.  repX scasd   2       -       -       -      5+8n    7+5n*   8+4n NP
  2651.  repX = repe or repz or repne or repnz
  2652.  * = 5 if n=0 (where n = count of bytes, words or dwords)
  2653.  Example
  2654.  repne scasb    ; Repeat comparison
  2655. contents
  2656. screen
  2657.  SETcc - Set byte on condition (386+)
  2658.  Description
  2659. Set the destination operand to 0 or 1 depending on the settings of the status flags (CF, SF, OF, ZF, and PF) in the EFLAGS register. The destination operand points to a byte register or a byte in memory. The condition code suffix (cc) indicates the condition being tested for. 
  2660. The terms "above" and "below" are associated with the CF flag and refer to the relationship between two unsigned integer values. The terms "greater" and "less" are associated with the SF and OF flags and refer to the relationship between two signed integer values. 3
  2661. Many of the SETcc instruction opcodes have alternate mnemonics. For example, the SETG (set byte if greater) and SETNLE (set if not less or equal) both have the same opcode and test for the same condition: ZF equals 0 and SF equals OF. These alternate mnemonics are provided to make code more intelligible. ,
  2662. Some languages represent a logical one as an integer with all bits set. This representation can be obtained by choosing the logically opposite condition for the SETcc instruction, then decrementing the result. For example, to test for overflow, use the SETNO instruction, then decrement the result. 
  2663.  Instruction  Description
  2664.  SETA         Set byte if above (CF=0 and ZF=0)
  2665.  SETAE        Set byte if above or equal (CF=0)
  2666.  SETB         Set byte if below (CF=1)
  2667.  SETBE        Set byte if below or equal (CF=1 or ZF=1)
  2668.  SETC         Set if carry (CF=1)
  2669.  SETE         Set byte if equal (ZF=1)
  2670.  SETG         Set byte if greater (ZF=0 and SF=OF)
  2671.  SETGE        Set byte if greater or equal (SF=OF)
  2672.  SETL         Set byte if less (SF<>OF)
  2673.  SETLE        Set byte if less or equal (ZF=1 or SF<>OF)
  2674.  SETNA        Set byte if not above (CF=1 or ZF=1)
  2675.  SETNAE       Set byte if not above or equal (CF=1)
  2676.  SETNB        Set byte if not below (CF=0)
  2677.  SETNBE       Set byte if not below or equal (CF=0 and ZF=0)
  2678.  SETNC        Set byte if not carry (CF=0)
  2679.  SETNE        Set byte if not equal (ZF=0)
  2680.  SETNG        Set byte if not greater (ZF=1 or SF<>OF)
  2681.  SETNGE       Set if not greater or equal (SF<>OF)
  2682.  SETNL        Set byte if not less (SF=OF)
  2683.  SETNLE       Set byte if not less or equal (ZF=0 and SF=OF)
  2684.  SETNO        Set byte if not overflow (OF=0)
  2685.  SETNP        Set byte if not parity (PF=0)
  2686.  SETNS        Set byte if not sign (SF=0)
  2687.  SETNZ        Set byte if not zero (ZF=0)
  2688.  SETO         Set byte if overflow (OF=1)
  2689.  SETP         Set byte if parity (PF=1)
  2690.  SETPE        Set byte if parity even (PF=1)
  2691.  SETPO        Set byte if parity odd (PF=0)
  2692.  SETS         Set byte if sign (SF=1)
  2693.  SETZ         Set byte if zero (ZF=1)
  2694.  Flags affected
  2695. None. C
  2696.  Instruction size and timings
  2697.  operand   bytes                           386     486     Pentium
  2698.  r8         3                               4      4/3     1/2  NP
  2699.  mem8     3+d(0-2)                          5      3/4     1/2  NP
  2700.  Example
  2701.  setne al       ; AL = 1 if ZF = 0
  2702. contents
  2703. screen
  2704.  SGDT/SIDT - Store Global/Interrupt Descriptor Table (286+)
  2705.  Description
  2706. Stores the contents of the global descriptor table register (GDTR) or the interrupt descriptor table register (IDTR) in the destination operand. The destination operand specifies a 6-byte memory location. If the operand-size attribute is 32 bits, the 16-bit limit field of the register is stored in the lower 2 bytes of the memory location and the 32-bit base address is stored in the upper 4 bytes. If the operand-size attribute is 16 bits, the limit is stored in the lower 2 bytes and the 24-bit base address is stored in the third, fourth, and fifth byte, with the sixth byte filled with 0s. 
  2707. The SGDT and SIDT instructions are only useful in operating-system software; however, they can be used in application programs without causing an exception to be generated. =
  2708. See LGDT/LIDT for information on loading the GDTR and IDTR. 
  2709. The 16-bit forms of the SGDT and SIDT instructions are compatible with the 286 processor, if the upper 8 bits are not referenced. The 286 processor fills these bits with 1s; the Pentium Pro, Pentium, 486, and 386 processors fill these bits with 0s. '
  2710.  Flags affected
  2711. None. C
  2712.  Instruction size and timings
  2713.  SGDT
  2714.  operand    bytes                   286     386     486     Pentium
  2715.  mem48       5                      11       9      10       4   NP
  2716.  SIDT
  2717.  operand    bytes                   286     386     486     Pentium
  2718.  mem48       5                      12       9      10       4   NP
  2719.  Example
  2720.  sgdt descriptor[ebx]           ; Store given descriptor
  2721. contents
  2722. screen
  2723.  SHLD - Double precision shift left (386+)
  2724.  Description
  2725. Shifts the first operand (destination operand) to the left the number of bits specified by the third operand (count operand). The second operand (source operand) provides bits to shift in from the right (starting with bit 0 of the destination operand). The destination operand can be a register or a memory location; the source operand is a register. The count operand is an unsigned integer that can be an immediate byte or the contents of the CL register. Only bits 0 through 4 of the count are used, which masks the count to a value between 0 and 31. If the count is greater than the operand size, the result in the destination operand is undefined. 
  2726. If the count is 1 or greater, the CF flag is filled with the last bit shifted out of the destination operand. For a 1-bit shift, the OF flag is set if a sign change occurred; otherwise, it is cleared. If the count operand is 0, the flags are not affected. N
  2727. The SHLD instruction is useful for multiprecision shifts of 64 bits or more. '
  2728.  Flags affected
  2729. If the count is 1 or greater, the CF flag is filled with the last bit shifted out of the destination operand and the SF, ZF, and PF flags are set according to the value of the result. For a 1-bit shift, the OF flag is set if a sign change occurred; otherwise, it is cleared. For shifts greater than 1 bit, the OF flag is undefined. If a shift occurs, the AF flag is undefined. If the count operand is 0, the flags are not affected. If the count is greater than the operand size, the flags are undefined. C
  2730.  Instruction size and timings
  2731.  operands        bytes                      386     486     Pentium
  2732.  reg, reg, imm    4                          3       2       4   NP
  2733.  mem, reg, imm   4+d(0-2)                    7       3       4   NP
  2734.  reg, reg, cl     4                          3       3       4   NP
  2735.  mem, reg, cl    4+d(0-2)                    7       4       5   NP
  2736.  Example
  2737.  shld eax, ebx, 16      ; Shift EAX 16 bits to the left with new bits coming
  2738.                         ; in from the right from EBX
  2739. contents
  2740. screen
  2741.  SHRD - Double precision shift right (386+)
  2742.  Description
  2743. Shifts the first operand (destination operand) to the right the number of bits specified by the third operand (count operand). The second operand (source operand) provides bits to shift in from the left (starting with the most significant bit of the destination operand). The destination operand can be a register or a memory location; the source operand is a register. The count operand is an unsigned integer that can be an immediate byte or the contents of the CL register. Only bits 0 through 4 of the count are used, which masks the count to a value between 0 and 31. If the count is greater than the operand size, the result in the destination operand is undefined. 
  2744. If the count is 1 or greater, the CF flag is filled with the last bit shifted out of the destination operand. For a 1-bit shift, the OF flag is set if a sign change occurred; otherwise, it is cleared. If the count operand is 0, the flags are not affected. N
  2745. The SHRD instruction is useful for multiprecision shifts of 64 bits or more. '
  2746.  Flags affected
  2747. If the count is 1 or greater, the CF flag is filled with the last bit shifted out of the destination operand and the SF, ZF, and PF flags are set according to the value of the result. For a 1-bit shift, the OF flag is set if a sign change occurred; otherwise, it is cleared. For shifts greater than 1 bit, the OF flag is undefined. If a shift occurs, the AF flag is undefined. If the count operand is 0, the flags are not affected. If the count is greater than the operand size, the flags are undefined. C
  2748.  Instruction size and timings
  2749.  operands        bytes                      386     486     Pentium
  2750.  reg, reg, imm    4                          3       2       4   NP
  2751.  mem, reg, imm   4+d(0-2)                    7       3       4   NP
  2752.  reg, reg, cl     4                          3       3       4   NP
  2753.  mem, reg, cl    4+d(0-2)                    7       4       5   NP
  2754.  Example
  2755.  shrd eax, ebx, 16      ; Shift EAX 16 bits to the right with new bits coming
  2756.                         ; in from the left from EBX
  2757. contents
  2758. screen
  2759.  SLDT - Store Local Descriptor Table register (286+)
  2760.  Description
  2761. Stores the segment selector from the local descriptor table register (LDTR) in the destination operand. The destination operand can be a general-purpose register or a memory location. The segment selector stored with this instruction points to the segment descriptor (located in the GDT) for the current LDT. This instruction can only be executed in protected mode. 
  2762. When the destination operand is a 32-bit register, the 16-bit segment selector is copied into the lower-order 16 bits of the register. The high-order 16 bits of the register are cleared to 0s for the Pentium Pro processor and are undefined for Pentium, 486, and 386 processors. When the destination operand is a memory location, the segment selector is written to memory as a 16-bit quantity, regardless of the operand size. t
  2763. The SLDT instruction is only useful in operating-system software; however, it can be used in application programs. '
  2764.  Flags affected
  2765. None. C
  2766.  Instruction size and timings
  2767.  operands   bytes                   286     386     486     Pentium
  2768.  r16         3                       2       2       2       2   NP
  2769.  mem16     3+d(0-2)                  3       2       3       2   NP
  2770.  Example
  2771.  sldt ax        ; Store LDT from AX
  2772. contents
  2773. screen
  2774.  SMSW - Store Machine Status Word (286+)
  2775.  Description
  2776. Stores the machine status word (bits 0 through 15 of control register CR0) into the destination operand. The destination operand can be a 16-bit general-purpose register or a memory location. k
  2777. When the destination operand is a 32-bit register, the low-order 16 bits of register CR0 are copied into the low-order 16 bits of the register and the upper 16 bits of the register are unde-fined. When the destination operand is a memory location, the low-order 16 bits of register CR0 are written to memory as a 16-bit quantity, regardless of the operand size. 
  2778. The SMSW instruction is only useful in operating-system software; however, it is not a privileged instruction and can be used in application programs. 
  2779. This instruction is provided for compatibility with the 286 processor. Programs and procedures intended to run on the Pentium Pro, Pentium, 486, and 386 processors should use the MOV (control registers) instruction to load the machine status word. '
  2780.  Flags affected
  2781. None. C
  2782.  Instruction size and timings
  2783.  operands   bytes                   286     386     486     Pentium
  2784.  r16         3                       2       2       2       4   NP
  2785.  mem16     3+d(0-2)                  3       3       3       4   NP
  2786.  Example
  2787.  smsw ax        ; Store Machine Status Word from AX
  2788. contents
  2789. screen
  2790.  STC - Set carry flag
  2791.  Description
  2792. Set the CF flag in the EFLAGS register. '
  2793.  Flags affected
  2794. The CF flag is set. The OF, ZF, SF, AF, and PF flags are unaffected. C
  2795.  Instruction size and timings
  2796.  bytes   8088    186     286     386     486     Pentium
  2797.   1       2       2       2       2       2       2   NP
  2798.  Example
  2799.  stc       ; Set carry flag
  2800. contents
  2801. screen
  2802.  STD - Set direction flag
  2803.  Description
  2804. Sets the DF flag in the EFLAGS register. When the DF flag is set to 1, string operations decrement the index registers (ESI and/or EDI). '
  2805.  Flags affected
  2806. The DF flag is set. The CF, OF, ZF, SF, AF, and PF flags are unaffected. C
  2807.  Instruction size and timings
  2808.  bytes   8088    186     286     386     486     Pentium
  2809.   1       2       2       2       2       2       2   NP
  2810.  Example
  2811.  std       ; Set direction flag
  2812. contents
  2813. screen
  2814.  STI - Set interrupt flag
  2815.  Description
  2816. Sets the interrupt flag (IF) in the EFLAGS register. After the IF flag is set, the processor begins responding to external, maskable interrupts after the next instruction is executed. The delayed effect of this instruction is provided to allow interrupts to be enabled just before returning from a procedure (or subroutine). For instance, if an STI instruction is followed by an RET instruction, the RET instruction is allowed to execute before external interrupts are recognized. This behavior allows external interrupts to be disabled at the beginning of a procedure and enabled again at the end of the procedure. If the STI instruction is followed by a CLI instruction (which clears the IF flag), the effect of the STI instruction is negated. q
  2817. The IF flag and the STI and CLI instructions have no affect on the generation of exceptions and NMI interrupts. '
  2818.  Flags affected
  2819. The IF flag is set to 1. C
  2820.  Instruction size and timings
  2821.  bytes   8088    186     286     386     486     Pentium
  2822.   1       2       2       2       3       5       7   NP
  2823.  Example
  2824.  sti       ; Set interrupt flag
  2825. contents
  2826. screen
  2827.  STOS - Store string data
  2828.  Description
  2829. Stores a byte, word, or doubleword from the AL, AX, or EAX register, respectively, into the destination operand. The destination operand is a memory location, the address of which is read from either the ES:EDI or the ES:DI registers (depending on the address-size attribute of the instruction, 32 or 16, respectively). The ES segment cannot be overridden with a segment over-ride prefix. 
  2830. At the assembly-code level, two forms of this instruction are allowed: the "explicit-operands" form and the "no-operands" form. The explicit-operands form (specified with the STOS mnemonic) is not supported by NASM. 
  2831. The no-operands form provides "short forms" of the byte, word, and doubleword versions of the STOS instructions. Here also ES:(E)DI is assumed to be the destination operand and the AL, AX, or EAX register is assumed to be the source operand. The size of the destination and source operands is selected with the mnemonic: STOSB (byte read from register AL), STOSW (word from AX), or STOSD (doubleword from EAX). 
  2832. After the byte, word, or doubleword is transferred from the AL, AX, or EAX register to the memory location, the (E)DI register is incremented or decremented automatically according to the setting of the DF flag in the EFLAGS register. (If the DF flag is 0, the (E)DI register is incremented; if the DF flag is 1, the (E)DI register is decremented.) The (E)DI register is incremented or decremented by 1 for byte operations, by 2 for word operations, or by 4 for doubleword operations. #
  2833. The STOSB, STOSW, and STOSD instructions can be preceded by the REP prefix for block loads of ECX bytes, words, or doublewords. More often, however, these instructions are used within a LOOP construct because data needs to be moved into the AL, AX, or EAX register before it can be stored. '
  2834.  Flags affected
  2835. None. C
  2836.  Instruction size and timings
  2837.  variations  bytes   8088    186     286     386     486     Pentium
  2838.  stosb        1      11      10       3       4       5       3   NP
  2839.  stosw        1      15      10       3       4       5       3   NP
  2840.  stosd        1       -       -       -       4       5       3   NP
  2841.  rep stosb    2      9+10n   6+9n    4+3n    5+5n    7+4n*   3+n  NP
  2842.  rep stosw    2      9+14n   6+9n    4+3n    5+5n    7+4n*   3+n  NP
  2843.  rep stosd    2       -       -       -      5+5n    7+4n*   3+n  NP
  2844.  * = 5 if n=0, 13 if n=1 (where n = count of bytes, words or dwords)
  2845.  Example
  2846.  rep stosb      ; Store ECX bytes from ax ax in ES:DI
  2847. contents
  2848. screen
  2849.  STR - Store task register (286+)
  2850.  Description
  2851. Stores the segment selector from the task register (TR) in the destination operand. The destination operand can be a general-purpose register or a memory location. The segment selector stored with this instruction points to the task state segment (TSS) for the currently running task. I
  2852. When the destination operand is a 32-bit register, the 16-bit segment selector is copied into the lower 16 bits of the register and the upper 16 bits of the register are cleared to 0s. When the destination operand is a memory location, the segment selector is written to memory as a 16-bit quantity, regardless of operand size. m
  2853. The STR instruction is useful only in operating-system software. It can only be executed in protected mode. '
  2854.  Flags affected
  2855. None. C
  2856.  Instruction size and timings
  2857.  operand     bytes                   286     386     486     Pentium
  2858.  r16          3                       2       2       2       2   NP
  2859.  mem16     3+d(0-2)                   3       2       3       2   NP
  2860.  Example
  2861.  str bx    ; Store task register to BX
  2862. contents
  2863. screen
  2864.  SUB - Integer subtraction
  2865.  Description
  2866. Subtracts the second operand (source operand) from the first operand (destination operand) and stores the result in the destination operand. The destination operand can be a register or a memory location; the source operand can be an immediate, register, or memory location. (However, two memory operands cannot be used in one instruction.) When an immediate value is used as an operand, it is sign-extended to the length of the destination operand format. &
  2867. The SUB instruction does not distinguish between signed or unsigned operands. Instead, the processor evaluates the result for both data types and sets the OF and CF flags to indicate a borrow in the signed or unsigned result, respectively. The SF flag indicates the sign of the signed result. '
  2868.  Flags affected
  2869. The OF, SF, ZF, AF, PF, and CF flags are set according to the result. C
  2870.  Instruction size and timings
  2871.  operands    bytes   8088    186     286     386     486     Pentium
  2872.  reg, reg     2       3       3       2       2       1       1   UV
  2873.  mem, reg  2+d(0,2)  24+EA   10       7       7       3       3   UV
  2874.  reg, mem  2+d(0,2)  13+EA   10       7       6       2       2   UV
  2875.  reg, imm  2+i(1,2)   4       4       3       2       1       1   UV
  2876.  mem, imm  2+d(0,2)  23+EA   16       7       7       3       3   UV*
  2877.             +i(1,2)
  2878.  acc, imm  1+i(1,2)   4       4       3       2       1       1   UV
  2879.  * = not pairable if there is a displacement and immediate
  2880.  Example
  2881.  sub eax, ebx           ; EAX = EAX - EBX
  2882. contents
  2883. screen
  2884.  TEST - Logical compare
  2885.  Description
  2886. Computes the bit-wise logical AND of first operand (source 1 operand) and the second operand (source 2 operand) and sets the SF, ZF, and PF status flags according to the result. The result is then discarded. '
  2887.  Flags affected
  2888. The OF and CF flags are cleared to 0. The SF, ZF, and PF flags are set according to the result. The state of the AF flag is undefined. C
  2889.  Instruction size and timings
  2890.  operands   bytes   8088    186     286     386     486     Pentium
  2891.  reg, reg    2       3       3       2       2       1       1   UV
  2892.  mem, reg 2+d(0,2)  13+EA   10       6       5       2       2   UV
  2893.  reg, mem 2+d(0,2)  13+EA   10       6       5       2       2   UV
  2894.  reg, imm 2+i(1,2)   5       4       3       2       1       1   UV
  2895.  mem, imm 2+d(0,2)  11+EA   10       6       5       2       2   UV*
  2896.            +i(1,2)
  2897.  acc, imm 1+i(1,2)   4       4       3       2       1       1   UV
  2898.  * = not pairable if there is a displacement and immediate
  2899.  Example
  2900.  test eax, ebx          ; Test values in EAX and EBX and set flags accordingly
  2901. contents
  2902. screen
  2903.  UD2 - Undefined instruction
  2904.  Description
  2905. Generates an invalid opcode. This instruction is provided for software testing to explicitly generate an invalid opcode. The opcode for this instruction is reserved for this purpose. g
  2906. Other than raising the invalid opcode exception, this instruction is the same as the NOP instruction. '
  2907.  Flags affected
  2908. None. C
  2909.  Instruction size and timings
  2910. Not available. 
  2911.  Example
  2912.  UD2       ; Raise invalid opcode exception
  2913. contents
  2914. screen
  2915.  VERR/VERW - Verify a segment for reading/writing (286+)
  2916.  Description
  2917. Verifies whether the code or data segment specified with the source operand is readable (VERR) or writable (VERW) from the current privilege level (CPL). The source operand is a 16-bit register or a memory location that contains the segment selector for the segment to be verified. If the segment is accessible and readable (VERR) or writable (VERW), the ZF flag is set; otherwise, the ZF flag is cleared. Code segments are never verified as writable. This check cannot be performed on system segments. ;
  2918. To set the ZF flag, the following conditions must be met: >
  2919.  The segment selector is not null.
  2920.  The selector must denote a descriptor within the bounds of the descriptor
  2921.    table (GDT or LDT).
  2922.  The selector must denote the descriptor of a code or data segment (not
  2923.    that of a system segment or gate).
  2924.  For the VERR instruction, the segment must be readable.
  2925.  For the VERW instruction, the segment must be a writable data segment.
  2926.  If the segment is not a conforming code segment, the segment's DPL must be
  2927.    greater than or equal to (have less or the same privilege as) both the CPL
  2928.    and the segment selector's RPL.
  2929. The validation performed is the same as is performed when a segment selector is loaded into the DS, ES, FS, or GS register, and the indicated access (read or write) is performed. The segment selector's value cannot result in a protection exception, enabling the software to anticipate possible segment access problems. '
  2930.  Flags affected
  2931. The ZF flag is set to 1 if the segment is accessible and readable (VERR) or writable (VERW); otherwise, it is cleared to 0. C
  2932.  Instruction size and timings
  2933.  VERR
  2934.  operand    bytes                   286     386     486     Pentium
  2935.  r16         3                      14      10      11       7   NP
  2936.  mem16    3+d(0,2)                  16      11      11       7   NP
  2937.  VERW
  2938.  operand    bytes                   286     386     486     Pentium
  2939.  r16         3                      14      15      11       7   NP
  2940.  mem16    3+d(0,2)                  16      16      11       7   NP
  2941.  Example
  2942.  verr ax        ; Verify segment given in AX is readable
  2943.  verw ax        ; Verify segment given in AX is writeable
  2944. contents
  2945. screen
  2946.  WAIT - Wait for coprocessor
  2947.  Description
  2948. Causes the processor to check for and handle pending, unmasked, floating-point exceptions before proceeding. )
  2949. This instruction is useful for synchronizing exceptions in critical sections of code. Coding a WAIT instruction after a floating-point instruction insures that any unmasked floating-point exceptions the instruction may raise are handled before the processor can modify the instruction's results. '
  2950.  Flags affected
  2951. The C0, C1, C2, and C3 FPU flags are undefined. C
  2952.  Instruction size and timings
  2953.   bytes   8088    186     286     386     486     Pentium
  2954.    1       4       6       3       6      1-3      1   NP
  2955.  Example
  2956.  wait           ; Wait for coprocessor
  2957. contents
  2958. screen
  2959.  WBINVD -  Write back and invalidate cache (486+)
  2960.  Description
  2961. Writes back all modified cache lines in the processor's internal cache to main memory and inval-idates (flushes) the internal caches. The instruction then issues a special-function bus cycle that directs external caches to also write back modified data and another bus cycle to indicate that the external caches should be invalidated. 
  2962. After executing this instruction, the processor does not wait for the external caches to complete their write-back and flushing operations before proceeding with instruction execution. It is the responsibility of hardware to respond to the cache write-back and flush signals. 
  2963. The WDINVD instruction is a privileged instruction. When the processor is running in protected mode, the CPL of a program or procedure must be 0 to execute this instruction. This instruction is also a serializing instruction. o
  2964. In situations where cache coherency with main memory is not a concern, software can use the INVD instruction. '
  2965.  Flags affected
  2966. None. C
  2967.  Instruction size and timings
  2968.  bytes                                   486     Pentium
  2969.   2                                       5    2000+  NP
  2970.  Example
  2971.  wbinvd          ; Write back and invalidate cache
  2972. contents
  2973. screen
  2974.  WRMSR - Write to Model Specific Register (Pentium+)
  2975.  Description
  2976. Writes the contents of registers EDX:EAX into the 64-bit model specific register (MSR) specified in the ECX register. The high-order 32 bits are copied from EDX and the low-order 32 bits are copied from EAX. Always set the undefined or reserved bits in an MSR to the values previously read. 
  2977. This instruction must be executed at privilege level 0 or in real-address mode; otherwise, a general protection exception will be generated. Specifying a reserved or unimplemented MSR address in ECX will also cause a general protection exception. 
  2978. When the WRMSR instruction is used to write to an MTRR, the TLBs are invalidated, including the global entries. (MTRRs are an implementation-specific feature of the Pentium Pro processor.) 
  2979. The MSRs control functions for testability, execution tracing, performance monitoring and machine check errors. The WRMSR instruction is a serializing instruction. x
  2980. The CPUID instruction should be used to determine whether MSRs are supported (EDX[5]=1) before using this instruction. 
  2981. The MSRs and the ability to read them with the WRMSR instruction were introduced into the Intel Architecture with the Pentium processor. Execution of this instruction by an Intel Architecture processor earlier than the Pentium processor results in an invalid opcode exception. '
  2982.  Flags affected
  2983. None. C
  2984.  Instruction size and timings
  2985.  bytes                                           Pentium
  2986.   2                                             30-45 NP
  2987.  Example
  2988.  wrmsr          ; Write EDX:EAX to MSR specified by ECX
  2989. contents
  2990. screen
  2991.  XADD - Exchange and add (486+)
  2992.  Description
  2993. Exchanges the first operand (destination operand) with the second operand (source operand), then loads the sum of the two values into the destination operand. The destination operand can be a register or a memory location; the source operand is a register. 2
  2994. This instruction can be used with a LOCK prefix. 
  2995. Intel Architecture processors earlier than the 486 processor do not recognize this instruction. If this instruction is used, you should provide an equivalent code sequence that runs on earlier processors. '
  2996.  Flags affected
  2997. The CF, PF, AF, SF, ZF, and OF flags are set according to the result of the addition, which is stored in the destination operand. C
  2998.  Instruction size and timings
  2999.  operands   bytes                                   486     Pentium
  3000.  reg, reg    3                                       3       3   NP
  3001.  mem, reg   3+d(0-2)                                 4       4   NP
  3002.  Example
  3003.  xadd eax, ebx          ; Exchange and add EAX and EBX
  3004. contents
  3005. screen
  3006.  XCHG - Exchange register/memory with register
  3007.  Description
  3008. Exchanges the contents of the destination (first) and source (second) operands. The operands can be two general-purpose registers or a register and a memory location. If a memory operand is referenced, the processor's locking protocol is automatically implemented for the duration of the exchange operation, regardless of the presence or absence of the LOCK prefix or of the value of the IOPL. p
  3009. This instruction is useful for implementing semaphores or similar data structures for process synchronization. ]
  3010. The XCHG instruction can also be used instead of the BSWAP instruction for 16-bit operands. '
  3011.  Flags affected
  3012. None. C
  3013.  Instruction size and timings
  3014.  operands   bytes   8088    186     286     386     486     Pentium
  3015.  reg, reg    2       4       4       3       3       3       3   NP
  3016.  reg, mem  2+d(0-2)  25+EA  17       5       5       5       3   NP
  3017.  mem, reg  2+d(0-2)  25+EA  17       5       5       5       3   NP
  3018.  acc, reg    1       3       3       3       3       3       2   NP
  3019.  reg, acc    1       3       3       3       3       3       2   NP
  3020.  Note: in this case acc = AX or EAX only
  3021.  Example
  3022.  xchg ax, dx    ; AX = DX and DX = original AX
  3023. contents
  3024. screen
  3025.  XLAT/XLATB - Table look-up translation
  3026.  Description
  3027. Locates a byte entry in a table in memory, using the contents of the AL register as a table index, then copies the contents of the table entry back into the AL register. The index in the AL register is treated as an unsigned integer. The XLAT and XLATB instructions get the base address of the table in memory from either the DS:EBX or the DS:BX registers (depending on the address-size attribute of the instruction, 32 or 16, respectively). (The DS segment may be overridden with a segment override prefix.) h
  3028. At the assembly-code level, two forms of this instruction are allowed: the "explicit-operand" form and the "no-operand" form. The explicit-operand form (specified with the XLAT mnemonic) allows the base address of the table to be specified explicitly with a symbol. This explicit-operands form is provided to allow documentation; however, note that the documentation provided by this form can be misleading. That is, the symbol does not have to specify the correct base address. The base address is always specified by the DS:(E)BX registers, which must be loaded correctly before the XLAT instruction is executed. 
  3029. The no-operands form (XLATB) provides a "short form" of the XLAT instructions. Here also the processor assumes that the DS:(E)BX registers contain the base address of the table. '
  3030.  Flags affected
  3031. None. C
  3032.  Instruction size and timings
  3033.  bytes   8088    186     286     386     486     Pentium
  3034.   1      11      11       5       5       4       4   NP
  3035.  Example
  3036.  xlat      ; Equivalent to MOV AL, [BX + AL]
  3037. contents
  3038. screen
  3039.  XOR - Logical exclusive OR
  3040.  Description
  3041. Performs a bitwise exclusive OR (XOR) operation on the destination (first) and source (second) operands and stores the result in the destination operand location. The source operand can be an immediate, a register, or a memory location; the destination operand can be a register or a memory location. (However, two memory operands cannot be used in one instruction.) Each bit of the result is 1 if the corresponding bits of the operands are different; each bit is 0 if the corresponding bits are the same. '
  3042.  Flags affected
  3043. The OF and CF flags are cleared; the SF, ZF, and PF flags are set according to the result. The state of the AF flag is undefined. C
  3044.  Instruction size and timings
  3045.  operands    bytes   8088    186     286     386     486     Pentium
  3046.  reg, reg     2       3       3       2       2       1       1   UV
  3047.  mem, reg  2+d(0,2)  24+EA   10       7       7       3       3   UV
  3048.  reg, mem  2+d(0,2)  13+EA   10       7       6       2       2   UV
  3049.  reg, imm  2+i(1,2)   4       4       3       2       1       1   UV
  3050.  mem, imm  2+d(0,2)  23+EA   16       7       7       3       3   UV*
  3051.             +i(1,2)
  3052.  acc, imm  1+i(1,2)   4       4       3       2       1       1   UV
  3053.  * = not pairable if there is a displacement and immediate
  3054.  Example
  3055.  xor eax, ebx           ; EAX = EAX xor EBX
  3056. contents
  3057. screen
  3058.  N!N"N#N$N%N&N'N(N)N*N+N,N-N.N/N0N1N2N3N4N5N6N7N8N9N:N;N<N=N>N?N@NANBNCNDNENFNGNHNINJNKNLNMNNNONPNQNRNSNTNUNVNWNXNYNZN[N\N]N^N_N`NaNbNcNdNeNfNgNhNiNjNkNlNmNnNoNpNqNrNsNtNuNvNwNxNyNzN{N|N}N~N
  3059.